import requests
from lxml import etree
from codeClass import YDMHttp#封装打码平台代码
path = 'code.jpg'
def getCodeText(imgPath,codeType):# 用户名username = '********'# 密码password = '******'# 软件ID,开发者分成必要参数。登录开发者后台【我的软件】获得!appid = 9812# 软件密钥,开发者分成必要参数。登录开发者后台【我的软件】获得!appkey = '3dfbf90******0d982ffb1c93'# 图片文件filename = imgPath# 验证码类型,# 例:1004表示4位字母数字,不同类型收费不同。请准确填写,否则影响识别率。在此查询所有类型 http://www.yundama.com/price.htmlcodetype = codeType# 超时时间,秒timeout = 20result = None# 检查if (username == 'username'):print('请设置好相关参数再测试')else:# 初始化yundama = YDMHttp(username, password, appid, appkey)# 登陆云打码uid = yundama.login();print('uid: %s' % uid)# 查询余额balance = yundama.balance();print('余额: %s' % balance)# 开始识别,图片路径,验证码类型ID,超时时间(秒),识别结果cid, result = yundama.decode(filename, codetype, timeout);print('cid: %s, result: %s' % (cid, result))return result#创建一个session对象
session = requests.session()#1、对验证码图片进行捕获和识别
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.87 Safari/537.36'}
url = "http://www.renren.com/SysHome.do"page_text=requests.get(url=url,headers=headers).text
tree = etree.HTML(page_text)
code_img_src = tree.xpath('//*[@id="verifyPic_login"]/@src')[0]
code_img_data = requests.get(url=code_img_src,headers=headers).content
with open('./code.jpg','wb') as fp:fp.write(code_img_data)#使用云打码对验证码进行识别
result = getCodeText('code.jpg',5000)
print(result)#post请求的发送(模拟登录)
login_url = 'http://www.renren.com/ajaxLogin/login?1=1&uniqueTimestamp=2020021132191'
data={'email': '144******6@qq.com','icode':result,'origURL': 'http://www.renren.com/home','domain': 'renren.com','key_id': '1','captcha_type': 'web_login','password': '7d279330f75******a27929432e3928dee4697792f3b0','rkey': '8a9fbb66f55b09f87d64c8111173b047','f': 'http%3A%2F%2Fwww.renren.com%2F422267891%2Fprofile'
}
#使用session对象进行pose请求发送
response=session.post(url = login_url,headers=headers,data=data)
print(response.status_code)
# login_page_text = response.text
# with open('renren.html','w',encoding='utf-8')as fp:
#     fp.write(login_page_text)#爬取当用户个人主页对应的页面数据
# datali_url = 'http://www.renren.com/422******91/profile'
# datail_page_text=requests.get(url=datali_url,headers=headers).text
# with open('xinxi.html','w',encoding='utf_8') as  fp:
#     fp.write(datail_page_text)#爬取当前用户的个人主页对应的页面数据
detail_url = "http://www.renren.com/422******91/profile"
#手动cookie处理,通过抓包工具获取cookie并封装
# hearders = {
#     'Cookie':'anonymid=k5m1u0gbnt93eb; _r01_=1; taihe_bi_sdk_uid=6a4882919050d9979b2b4c7d57fd11cc; __utma=151146938.876193738.1579500553.1579500553.1579500553.1; __utmz=151146938.1579500553.1.1.utmcsr=renren.com|utmccn=(referral)|utmcmd=referral|utmcct=/; _ga=GA1.2.876193738.1579500553; jebe_key=c83edb03-b9ac-43ed-ad6f-78af6f194b74%7C4ac7eb0a940e0112ea703de4ac164901%7C1579501523827%7C1%7C1579501523923; _de=31E04E93103A701B1DE9EF59AA5E391C6DEBB8C2103DE356; depovince=GW; jebecookies=16c8bca8-6828-4f5d-ab23-c9292647c1c5|||||; JSESSIONID=abcyFnFLuBhsZeuLAv9cx; ick_login=a4b4027e-e9fc-4fc8-85a4-3c1659a8a595; taihe_bi_sdk_session=6cbdd9d7c5bcbb7ed0187441d212c9ad; p=ada0140d5dd256c429fe2cb86b0a97e41; first_login_flag=1; ln_uact=144******06@qq.com; ln_hurl=http://head.xiaonei.com/photos/0/0/men_main.gif; t=1b56adb9ba187ed088a76ffdbf3728941; societyguester=1b56adb9ba187ed088a76ffdbf3728941; id=422267891; xnsid=42a947c9; ver=7.0; loginfrom=null; jebe_key=c83edb03-b9ac-43ed-ad6f-78af6f194b74%7C4ac7eb0a940e0112ea703de4ac164901%7C1583724542889%7C1%7C1583724544491; wp_fold=0'
# }
#使用携带coolie的serssion进行get请求的发送
detai_page_test = session.get(url=detail_url,headers=headers).text
with open('bobo.html','w',encoding='utf-8') as fp:fp.write(detai_page_test)

python爬虫学习(十八)人人网cookie登录相关推荐

  1. python爬虫学习之淘宝模拟登录

    使用教程 下载chrome浏览器 查看chrome浏览器的版本号,对应版本号的chromedriver驱动 pip安装下列包  pip install selenium 登录微博,并通过微博绑定淘宝账 ...

  2. Python爬虫学习(八)识别12306的验证码信息

    安装.导入第三方模块 安装: pip3 install Pillowimage 模块: Image模块是在Python PIL图像处理中常见的模块,主要是用于对这个图像的基本处理,它配合open.sa ...

  3. Python爬虫学习5:使用cookie访问网页(以豆瓣为例)

    1. 先在浏览器上登录豆瓣,登录成功后打开开发者工具,可以查看到Cookie. 第一次登录后,短时间内再次打开此页面时,会发现系统已经保存了cookie, 不用再重新登录.时间长了cookie会失效, ...

  4. 【Python爬虫学习】八、股票数据定向爬虫(2020年1月31日成功爬取中财网,百度股市通web版404了)

    功能描述: 目标:获取股票的名称和交易信息 输出:保存到文件中 程序结构设计: 步骤1:从中财网http://quote.cfi.cn/stockList.aspx获取股票列表 步骤2:根据股票列表获 ...

  5. [Python爬虫] 之十八:Selenium +phantomjs 利用 pyquery抓取电视之家网数据

    一.介绍 本例子用Selenium +phantomjs爬取电视之家(http://www.tvhome.com/news/)的资讯信息,输入给定关键字抓取资讯信息. 给定关键字:数字:融合:电视 抓 ...

  6. Python 爬虫学习 系列教程

    Python爬虫 --- 中高级爬虫学习路线 :https://www.cnblogs.com/Eeyhan/p/14148832.html 看不清图时,可以把图片保存到本地在打开查看... Pyth ...

  7. Python爬虫学习手册

    like:128-Python 爬取落网音乐 like:127-[图文详解]python爬虫实战--5分钟做个图片自动下载器 like:97-用Python写一个简单的微博爬虫 like:87-爬虫抓 ...

  8. Python爬虫学习系列教程

    大家好哈,我呢最近在学习Python爬虫,感觉非常有意思,真的让生活可以方便很多.学习过程中我把一些学习的笔记总结下来,还记录了一些自己实际写的一些小爬虫,在这里跟大家一同分享,希望对Python爬虫 ...

  9. Python爬虫学习系列教程-----------爬虫系列 你值的收藏

    静觅 » Python爬虫学习系列教程:http://cuiqingcai.com/1052.html 大家好哈,我呢最近在学习Python爬虫,感觉非常有意思,真的让生活可以方便很多.学习过程中我把 ...

  10. python爬虫学习之路

    python爬虫学习之路 第一章:爬虫基础 1.爬虫前奏 爬虫的实际例子: 1.搜索引擎(百度.谷歌.360搜索等.) 2.伯乐在线 3.惠惠购物助手 4.数据分析与研究(数据冰山知乎专栏). 5.抢 ...

最新文章

  1. Qt 程序在 Windows 下的发布
  2. 组件注册——@ComponentScan自动扫描组件指定扫描规则
  3. python使用matplotlib画图,绘制三维、二维曲线。设置字体大小以及坐标系间距等
  4. 启明云端分享|ESP32-S3开发环境搭建,这里我们会介绍两个比较常用的开发环境搭建:WINDOWS\LINUX
  5. centos7安装redis的正确姿势
  6. 【CodeVS】1083 Cantor表
  7. 前端学习(2255)代码是如何冲突得
  8. 【操作系统】进程调度的不同层次
  9. 软件测试学习(二)测试用例例子、黑盒测试(一)
  10. Python_代码练习_写一个判断是否为小数的函数
  11. oracle11g查看数据库名称,oracle11g系列 事物和常用数据库对象
  12. K8S查看容器日志、进入容器内部
  13. css如何在下拉框添加倒三角,CSS给选中元素增加倒三角形(示例代码)
  14. matlab二维绘图plot和fplot函数
  15. EPIC 审批流程设置 BAdI:示例
  16. 读书笔记---《编写可读代码的艺术》
  17. 易语言如何防止进程被终止或者如何隐藏进程
  18. 【Unity】Unity开发进阶(六)UnityEvent使用与源码解析
  19. 如何在多台电脑间同步
  20. 卡巴斯基或遭攻击,黑客称窃取了40000份文件资料

热门文章

  1. 多ip服务器代理设置
  2. 资本家:你别坏了规矩!
  3. ArcGIS中坡长的计算
  4. 【干货】气体分析仪与气体检测仪的区别
  5. 五轴数控转台_你真的了解五轴加工吗?看完你会恍然大悟!
  6. 李兴华java视频在线观看_李兴华Java开发实战经典视频教程_IT教程网
  7. 云南b系列服务器机柜,标准B型网络服务器机柜
  8. 郝斌老师-C语言视频教程(全180讲)
  9. 易语言D3DHook
  10. 微信小程序:地图导航功能实现完整源代码附效果图,讲解