[python爬虫]模拟登陆扇贝单词
登完了教务处,就试试登陆别的吧,这次选择的是扇贝单词的网页版,貌似是用djando搭建的。
用chrome的开发者工具先观察一下登陆的过程,可以发现post表单的内容还是比较简单的,就是自己的用户名密码,还有一个csrftoken的东东,虽然不知道是啥,至少用户名密码没有进行加密处理一切就好办了。
顺便学习一下什么是csrf。
CSRF(Cross-site request forgery)跨站请求伪造,由于目标站无token/referer限制,导致攻击者可以用户的身份完成操作达到各种目的。
不明觉厉。。
多登陆了几次发现这个csrf值是会变每次随机生成的,大概也是为了安全吧,那么怎么获得呢。再次分析一下登陆过程,发现中未登陆前的cookie里会有一个csrf值,和登陆后post表单里的值是一样的,大概就是服务器先随机生成一个token,跟随用户信息一起提交的时候检测是否一致,一致了才产生一个session登陆成功,防止别人盗用这个身份进行攻击,多了一道防御吧。。那么既然如此我们就从cookie中拿出csrf跟随表单一起提交就可以了。
登陆过程还遇到了两个问题,一开始总是登陆超时,是因为Content-Length这个头部,注释掉就好了,后来爬下来的信息出现编码问题,'Accept-Encoding' : 'gzip, deflate'这个头部注释掉也就好了。具体原因我还说不太清楚&
[python爬虫]模拟登陆扇贝单词相关推荐
- python爬虫——模拟登陆
参考链接:https://blog.csdn.net/weixin_39875941/article/details/109878457 模拟登陆 Python网络爬虫应用十分广泛,但是有些网页需要用 ...
- Python爬虫-爬取扇贝单词(Xpath)
爬取扇贝单词 ====================== ====================================================================== ...
- python爬虫登录网站_主流网站 Python 爬虫模拟登陆方法汇总
欢迎关注我的公众号:高级农民工,博客:高级农民工,阅读体验更好. 摘要:介绍微信.知乎.新浪等一众主流网站的模拟登陆爬取方法. 网络上有形形色色的网站,不同类型的网站爬虫策略不同,难易程度也不一样.从 ...
- Python爬取网站用户手机号_主流网站 Python 爬虫模拟登陆方法汇总
欢迎关注我的公众号:高级农民工,博客:高级农民工,阅读体验更好. 摘要:介绍微信.知乎.新浪等一众主流网站的模拟登陆爬取方法. 网络上有形形色色的网站,不同类型的网站爬虫策略不同,难易程度也不一样.从 ...
- python爬虫模拟登陆知乎网
自从暑假学了大概一个月左右的爬虫,开学之后就没怎么搞爬虫了,当时也就学到scrapy框架就放下了,大致了解了一下框架,不是太理解,但是在这之前本人的爬虫水平也仅仅局限于爬取简单页面,爬取动态页面也稍微 ...
- python爬虫模拟登陆豆瓣
一.简介 工具:Google chrome python 爬虫登陆方式一般有两种: 第一种:使用post登陆,即需要输入账号密码等选项, 第二种:使用cookies登陆,即把已登陆好账号的cookie ...
- python爬虫-模拟登陆新浪微+博爬取感兴趣人的所有信息
新浪微博的登录非常麻烦,涉及到预登录,用户名密码加密等等一系列问题 而现在pc端的新浪微博大量使用了ajax技术,必须要鼠标下滑多次才能加载一个页面的所有信息 图省事,使用了selenium_Plan ...
- python爬虫模拟登陆腾讯课堂
根据腾讯课堂网页登陆问题进行解说(需要安装谷歌浏览器): 1.导入库 import requests from selenium import webdriver 2.根据腾讯课堂链接,进入页面,获取 ...
- python实用脚本 知乎_Python 爬虫模拟登陆知乎
在之前写过一篇使用python爬虫爬取电影天堂资源的文章,重点是如何解析页面和提高爬虫的效率.由于电影天堂上的资源获取权限是所有人都一样的,所以不需要进行登录验证操作,写完那篇文章后又花了些时间研究了 ...
最新文章
- mysql 运行 sql 脚本
- Leetcode--141. 环形链表
- win10搭建java开发环境_如何在WIN10搭建Java开发环境
- 【计数网络】梯度累加增加LCFCN的BatchSize
- smtp、esmtp、pop3命令使用
- go插件 vscode 报错_win10环境下配置golang+vscode【解决install failed情况】
- Linux下C语言开发环境的搭建
- 移动硬盘在Mac上无法拷贝或删除文件的解决办法
- 自然语言处理(NLP):08 PyTorch深度学习之LSTM微博评论情感分析
- android ota功能,支持 OTA 更新 | Android 开源项目 | Android Open Source Project
- Ceph剖析:Leader选举
- 陀螺仪程序---可直接用
- 计算机网络协议分析 第三课 PAP,CHAP,PPPoE
- 【转】这些JavaScript编程黑科技,装逼指南,高逼格代码,让你惊叹不已
- 动态规划问题——最长公共子序列问题
- 三维导航,快速三维立体查看CAD图纸
- association内属性及作用
- 3.1 Web前端:实战电商页面1:静态布局
- 关于诉讼融资,你需要了解的4件事儿~
- 基于LPC55xxx CM33核的TrustZone原理与应用
热门文章
- 关于 varchar max的误区
- 对抗攻击样本范数:L0,L2,L∞
- Forth GPON OLT Internet业务配置指导
- WTM重大更新,多租户和单点登录
- 2021年软考网络工程师备考
- 快乐肥宅水--辗转相除法
- 奶爸日记15 - 王子公主
- chrome浏览器快速切换搜索引擎
- oracle 修改nls_nchar_characterset,Oracle的NLS_NCHAR_CHARACTERSET和NLS_CHARACTERSET之间的区别...
- python 学习第一课