一.分析

验证码:

登录抓包:登录不一定成功,但是接口可以捕获到


formdata:

获取 ‘__VIEWSTATEGENERATOR’ 和 ‘__VIEWSTATE’ 的值

二.代码

import requests
from bs4 import BeautifulSoup
import urllib.requestheaders = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/74.0.3729.131 Safari/537.36',
}def download_code(s):url = 'https://so.gushiwen.org/user/login.aspx?from=http://so.gushiwen.org/user/collect.aspx'r = s.get(url=url, headers=headers)soup = BeautifulSoup(r.text, 'lxml')# 得到图片链接image_src = 'https://so.gushiwen.org' + soup.find('img', id='imgCode')['src']# print(image_src) # https://so.gushiwen.org/RandCode.ashxr_image = s.get(image_src,headers=headers)with open('code.png', 'wb') as fp:fp.write(r_image.content)# 表单所需要的两个参数__VIEWSTATEGENERATOR = soup.find('input', id='__VIEWSTATEGENERATOR')['value']__VIEWSTATE = soup.find('input', id='__VIEWSTATE')['value']return __VIEWSTATEGENERATOR, __VIEWSTATEdef login(viewg, view, s):post_url = 'https://so.gushiwen.org/user/login.aspx?from='# 提示用户输入验证码code = input("请输入验证码:")formdata = {'pwd': '自己的密码','from': '','email': '13772804203','denglu ': '登录','code': code,'__VIEWSTATEGENERATOR': viewg,'__VIEWSTATE': view,}r = s.post(url=post_url, headers=headers, data=formdata)with open('古诗.html', 'w', encoding='utf8') as fp:fp.write(r.text)def main():# 创建会话s = requests.Session()# 下载验证码到本地viewg,view = download_code(s)# 向post地址发送请求login(viewg, view, s)if __name__ == '__main__':main()


python爬虫——验证码(1)下载到本地之登录古诗文网相关推荐

  1. 爬虫day01(上午) 模拟登录古诗文网

    前言:今天是学习爬虫的第一天,因为看的教学视频比较老,所以很多案例都不能用了,于是我自己发挥动手操作,做了个比视频里更有含金量的练习,由于与视频案例大有不同,所以期间发生了点问题,经过探索现已解决,留 ...

  2. python爬虫模拟登录古诗文网站

    爬取目标网站https://so.gushiwen.cn/user/login.aspx?from=http://so.gushiwen.cn/user/collect.aspx?type=s 工具: ...

  3. python爬虫+ffmpeg批量下载ts文件,解密合并成mp4

    标题 python爬虫+ffmpeg批量下载ts文件,解密合并成mp4 文章目录 标题 前言 一.分析目标 二.寻找url规律 三.写代码 总结 前言 (第一次写博客,写的不好请见谅哈~~) 目标是大 ...

  4. python爬虫教程下载-Python爬虫视频教程全集下载

    原标题:Python爬虫视频教程全集下载 Python作为一门高级编程语言,在编程中应用得非常广泛.随着人工智能的发展,python人才的需求更大.当然,这也吸引了很多同学选择自学Python爬虫.P ...

  5. python爬虫实现批量下载百度图片

    今天和小伙伴们合作一个小项目,需要用到景点图片作为数据源,在百度上搜索了一些图片,感觉一个一个手动保存太过麻烦,于是想到用爬虫来下载图片. 本次代码用到了下列一些python模块,需要预先安装Beau ...

  6. Python 爬虫 m3u8的下载及AES解密

    python爬虫 m3u8的下载及AES加密的解密 前言 2023.1.23更新 线程池版 完整代码 异步协程版 前言 这里与hxdm分享一篇关于m3u8视频流的爬取下载合并成mp4视频的方法,并且支 ...

  7. python爬虫实现音乐下载

    python爬虫实现音乐下载 音乐下载功能模块 # !/usr/bin/env python # -*- coding:UTF-8 -*- # # @Version : 1.0 # @Time : 2 ...

  8. Python爬虫验证码识别四

    反爬机制:验证码,  第三方自动识别(推荐) 注意:使用该平台识别验证码,必须将验证码事先下载到本地,然后再将本地存储的验证码提交给平台的示例程序进行识别操作. 使用打码平台识别验证码的编码流程:   ...

  9. python爬虫-古诗文网验证码识别

    文章目录 一.前期准备 二.示例代码 一.前期准备 古诗文网验证码识别,是通过对古诗文网登陆界面的验证码图片进行识别的,利用专门的验证码识别网站,可以提取验证码图片中的验证码 网站推荐:超级鹰 注册登 ...

最新文章

  1. Node 抓取非utf-8编码页面
  2. 前端学习(2902):javascript浏览器的历史
  3. 最优化学习笔记(四)——最速下降法
  4. 34深入理解C指针之---通过字符串传递函数
  5. 初次使用nginx 搭建http2.0
  6. VS F5自动编译 F5不自动编译
  7. Atitit 提升扩展性bpmn艾提拉总结 工作流 目录 1.1. 尽管BPMN 1.1全面地处理了过程建模符号,但它实质上缺少解决交换格式(用于图交换)的问题 1 1.2. BPMN 2.0中使
  8. 阿帕虎题库管理系统服务器,阿帕虎题库管理系统
  9. 网页设计中文标题h1~h4应用技巧
  10. 教你如何玩转豆瓣(douban) 豆瓣使用入门!
  11. 计算机控制原理 实验,计算机控制原理实验-直流电机实验
  12. 苹果对中国手机产业链有多重要?欧菲光没了它就巨亏27亿
  13. chan相关的知识点
  14. 今天,Java 12 正式发布了! 你在用哪个版本?
  15. python3 字典遍历操作
  16. 层次分析法2:Matlab实现层次分析法的代码详解
  17. 802.11省电机制SM Power Save(Spatial Multiplexing Power Save)
  18. 市场热度最高的手机开单库存管理软件
  19. i2c驱动之i2c-dev驱动
  20. 前端获取定位信息的方法

热门文章

  1. 一款功能强大的数据恢复软件合集,不进来看看?
  2. Java | 浅谈多态中的向上转型与向下转型
  3. php 批量插件下载,网页链接批量复制插件下载 Bulk URL Opener (网页链接批量复制插件) v1.11.1 免费版 下载-脚本之家...
  4. JAVA子类继承多个_Java的一个子类可以继承自多个父类。
  5. jQuery基础与JavaScript与CSS交互-第五章
  6. 哔哩哔哩html5播放器,哔哩哔哩(Bilibili)播放器扩展_v2.0.4
  7. 当全世界只有一台电脑
  8. 洗拖地一体机哪个牌子好,四款好用的洗拖地一体机分享
  9. Java开发基础_03
  10. 世界顶级的杀毒软件——比特梵德