登完了教务处,就试试登陆别的吧,这次选择的是扇贝单词的网页版,貌似是用djando搭建的。

用chrome的开发者工具先观察一下登陆的过程,可以发现post表单的内容还是比较简单的,就是自己的用户名密码,还有一个csrftoken的东东,虽然不知道是啥,至少用户名密码没有进行加密处理一切就好办了。

顺便学习一下什么是csrf。

CSRF(Cross-site request forgery)跨站请求伪造,由于目标站无token/referer限制,导致攻击者可以用户的身份完成操作达到各种目的。

不明觉厉。。

多登陆了几次发现这个csrf值是会变每次随机生成的,大概也是为了安全吧,那么怎么获得呢。再次分析一下登陆过程,发现中未登陆前的cookie里会有一个csrf值,和登陆后post表单里的值是一样的,大概就是服务器先随机生成一个token,跟随用户信息一起提交的时候检测是否一致,一致了才产生一个session登陆成功,防止别人盗用这个身份进行攻击,多了一道防御吧。。那么既然如此我们就从cookie中拿出csrf跟随表单一起提交就可以了。

登陆过程还遇到了两个问题,一开始总是登陆超时,是因为Content-Length这个头部,注释掉就好了,后来爬下来的信息出现编码问题,'Accept-Encoding' : 'gzip, deflate'这个头部注释掉也就好了。具体原因我还说不太清楚&

[python爬虫]模拟登陆扇贝单词相关推荐

  1. python爬虫——模拟登陆

    参考链接:https://blog.csdn.net/weixin_39875941/article/details/109878457 模拟登陆 Python网络爬虫应用十分广泛,但是有些网页需要用 ...

  2. Python爬虫-爬取扇贝单词(Xpath)

    爬取扇贝单词 ====================== ====================================================================== ...

  3. python爬虫登录网站_主流网站 Python 爬虫模拟登陆方法汇总

    欢迎关注我的公众号:高级农民工,博客:高级农民工,阅读体验更好. 摘要:介绍微信.知乎.新浪等一众主流网站的模拟登陆爬取方法. 网络上有形形色色的网站,不同类型的网站爬虫策略不同,难易程度也不一样.从 ...

  4. Python爬取网站用户手机号_主流网站 Python 爬虫模拟登陆方法汇总

    欢迎关注我的公众号:高级农民工,博客:高级农民工,阅读体验更好. 摘要:介绍微信.知乎.新浪等一众主流网站的模拟登陆爬取方法. 网络上有形形色色的网站,不同类型的网站爬虫策略不同,难易程度也不一样.从 ...

  5. python爬虫模拟登陆知乎网

    自从暑假学了大概一个月左右的爬虫,开学之后就没怎么搞爬虫了,当时也就学到scrapy框架就放下了,大致了解了一下框架,不是太理解,但是在这之前本人的爬虫水平也仅仅局限于爬取简单页面,爬取动态页面也稍微 ...

  6. python爬虫模拟登陆豆瓣

    一.简介 工具:Google chrome python 爬虫登陆方式一般有两种: 第一种:使用post登陆,即需要输入账号密码等选项, 第二种:使用cookies登陆,即把已登陆好账号的cookie ...

  7. python爬虫-模拟登陆新浪微+博爬取感兴趣人的所有信息

    新浪微博的登录非常麻烦,涉及到预登录,用户名密码加密等等一系列问题 而现在pc端的新浪微博大量使用了ajax技术,必须要鼠标下滑多次才能加载一个页面的所有信息 图省事,使用了selenium_Plan ...

  8. python爬虫模拟登陆腾讯课堂

    根据腾讯课堂网页登陆问题进行解说(需要安装谷歌浏览器): 1.导入库 import requests from selenium import webdriver 2.根据腾讯课堂链接,进入页面,获取 ...

  9. python实用脚本 知乎_Python 爬虫模拟登陆知乎

    在之前写过一篇使用python爬虫爬取电影天堂资源的文章,重点是如何解析页面和提高爬虫的效率.由于电影天堂上的资源获取权限是所有人都一样的,所以不需要进行登录验证操作,写完那篇文章后又花了些时间研究了 ...

最新文章

  1. mysql 运行 sql 脚本
  2. Leetcode--141. 环形链表
  3. win10搭建java开发环境_如何在WIN10搭建Java开发环境
  4. 【计数网络】梯度累加增加LCFCN的BatchSize
  5. smtp、esmtp、pop3命令使用
  6. go插件 vscode 报错_win10环境下配置golang+vscode【解决install failed情况】
  7. Linux下C语言开发环境的搭建
  8. 移动硬盘在Mac上无法拷贝或删除文件的解决办法
  9. 自然语言处理(NLP):08 PyTorch深度学习之LSTM微博评论情感分析
  10. android ota功能,支持 OTA 更新  |  Android 开源项目  |  Android Open Source Project
  11. Ceph剖析:Leader选举
  12. 陀螺仪程序---可直接用
  13. 计算机网络协议分析 第三课 PAP,CHAP,PPPoE
  14. 【转】这些JavaScript编程黑科技,装逼指南,高逼格代码,让你惊叹不已
  15. 动态规划问题——最长公共子序列问题
  16. 三维导航,快速三维立体查看CAD图纸
  17. association内属性及作用
  18. 3.1 Web前端:实战电商页面1:静态布局
  19. 关于诉讼融资,你需要了解的4件事儿~
  20. 基于LPC55xxx CM33核的TrustZone原理与应用

热门文章

  1. 关于 varchar max的误区
  2. 对抗攻击样本范数:L0,L2,L∞
  3. Forth GPON OLT Internet业务配置指导
  4. WTM重大更新,多租户和单点登录
  5. 2021年软考网络工程师备考
  6. 快乐肥宅水--辗转相除法
  7. 奶爸日记15 - 王子公主
  8. chrome浏览器快速切换搜索引擎
  9. oracle 修改nls_nchar_characterset,Oracle的NLS_NCHAR_CHARACTERSET和NLS_CHARACTERSET之间的区别...
  10. python 学习第一课