import requests
import json
import pymysql#雪球网i = 1  #记录第一个ajax请求
max_id = -1
count = 10
while i <= 20:url = 'https://xueqiu.com/v4/statuses/public_timeline_by_category.json?since_id=-1&max_id={}&count={}&category=111'.format(str(max_id),str(count))# url1 = 'https://xueqiu.com/v4/statuses/public_timeline_by_category.json?since_id=-1&max_id=184275&count=15&category=111'# url2 = 'https://xueqiu.com/v4/statuses/public_timeline_by_category.json?since_id=-1&max_id=184086&count=15&category=111'headers = {'Accept': '*/*',# ' Accept-Encoding':'gzip, deflate, br','Accept-Language': 'zh-CN,zh;q=0.9','Connection': 'keep-alive','Cookie': 'aliyungf_tc=AQAAAOtGklSxGQwAUhVFeTaV3wKjdope; xq_a_token=584d0cf8d5a5a9809761f2244d8d272bac729ed4; xq_a_token.sig=x0gT9jm6qnwd-ddLu66T3A8KiVA; xq_r_token=98f278457fc4e1e5eb0846e36a7296e642b8138a; xq_r_token.sig=2Uxv_DgYTcCjz7qx4j570JpNHIs; _ga=GA1.2.557243314.1534335292; _gid=GA1.2.1222731268.1534335292; _gat_gtag_UA_16079156_4=1; Hm_lvt_1db88642e346389874251b5a1eded6e3=1534335293; Hm_lpvt_1db88642e346389874251b5a1eded6e3=1534335293; u=121534335293404; device_id=4633cb10d0c99f1a3733f5feb4427c50','Host': 'xueqiu.com','Referer': 'https://xueqiu.com/','User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/68.0.3440.84 Safari/537.36','X-Requested-With': 'XMLHttpRequest',}response = requests.get(url, headers=headers)# print(response.text)# print(type(response.text))res_dict = json.loads(response.text)print(res_dict)# max_id = res_dict['next_max_id']# print(max_id)max_id = res_dict['next_max_id']print(max_id)j = 0while j < count:data = json.loads(res_dict['list'][j]['data'])print(data)uid = data['id']title = data['title']print(title)desc = data['description']target = data['target']db = pymysql.connect(host='127.0.0.1', user='root', password='XXXX', port=3306, database='XXX')cursor = db.cursor()sql = "insert into user(uid,title,description,target) values('{}','{}','{}','{}')".format(uid,title,desc,target)cursor.execute(sql)db.commit()cursor.close()db.close()j += 1# max_id = res_dict['next_max_id']# print(max_id)i += 1count = 15

爬虫--爬取雪球网数据相关推荐

  1. 简单使用resquests爬取雪球网数据,分析股票走势

    简单使用resquests爬取雪球网数据,分析股票走势 import requests import pymongo import json # 数据库初始化 client = pymongo.Mon ...

  2. python爬虫爬取雪球网_Python爬虫爬取天天基金网基金排行

    本文以天天基金网为例,爬取网站上的基金排行并存储在本地记事本中和MongoDB数据库中. 打开网页我们看到每页最多显示50个基金信息,在源代码中,我们发现其他页码没有跳转链接.但是我们选择右下角不分页 ...

  3. Python爬虫 爬取雪球网部分数据

    import requests import jsonurl = {'https://xueqiu.com/v4/statuses/public_timeline_by_category.json?s ...

  4. PyQt5制作一个爬虫小工具,爬取雪球网上市公司的财务数据

    本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. 以下文章来源于可以叫我才哥 ,作者:可以叫我才哥 最近有朋友需要帮忙写个爬虫脚本,爬取雪球网一些上 ...

  5. 对爬虫爬取到的数据进行存储

    已写章节 第一章 网络爬虫入门 第二章 基本库的使用 第三章 解析库的使用 第四章 数据存储 第五章 动态网页的抓取 文章目录 已写章节 第四章 数据存储 4.1 文件存储 4.1.1 TXT文件存储 ...

  6. python 百度百科 爬虫_爬虫爬取百度百科数据

    以前段时间<青春有你2>为例,我们使用Python来爬取百度百科中<青春有你2>所有参赛选手的信息. 什么是爬虫? 为了获取大量的互联网数据,我们自然想到使用爬虫代替我们完成这 ...

  7. mysql scrapy 重复数据_大数据python(scrapy)爬虫爬取招聘网站数据并存入mysql后分析...

    基于Scrapy的爬虫爬取腾讯招聘网站岗位数据视频(见本头条号视频) 根据TIOBE语言排行榜更新的最新程序语言使用排行榜显示,python位居第三,同比增加2.39%,为什么会越来越火,越来越受欢迎 ...

  8. python xpath循环_Python爬虫 爬取北京二手房数据

    点击蓝字"python教程"关注我们哟! 前言 Python现在非常火,语法简单而且功能强大,很多同学都想学Python!所以小的给各位看官们准备了高价值Python学习视频教程及 ...

  9. 《崔庆才Python3网络爬虫开发实战教程》学习笔记(5):将爬虫爬取到的数据存储到TXT,Word,Excel,Json等文件中

    本篇博文是自己在学习崔庆才的<Python3网络爬虫开发实战教程>的学习笔记系列,此套教程共5章,加起来共有34节课,内容非常详细丰富!如果你也要这套视频教程的话,关注我公众号[小众技术] ...

  10. python爬取网页代码-python爬虫爬取网页所有数据详细教程

    Python爬虫可通过查找一个或多个域的所有 URL 从 Web 收集数据.Python 有几个流行的网络爬虫库和框架.大家熟知的就是python爬取网页数据,对于没有编程技术的普通人来说,怎么才能快 ...

最新文章

  1. TensorFlow 图像数据预处理及可视化
  2. 校招c语言面试题目及答案,C/C++学习之路(一)校招后端面试题及答案(作者回忆版)...
  3. efcore 更新关联表_如何在生产环境下用好EFCore
  4. C++ 中复杂的声明
  5. MySQL无法创建外键、查询外键的属性
  6. 平常代码练习报错问题解决
  7. Codeforces 120F Spiders
  8. 实战爬虫:python爬虫学习笔记之爬取大前端网站
  9. 蓝桥 PREV-34 历届试题 矩阵翻硬币
  10. Linux C++(QT) 下获取 CPU 序列号(processor serial number)
  11. 办公室电脑里的文件和家里电脑的文件同步,有什么便签软件可以实现
  12. 【C语言/C++】switch使用方法介绍
  13. Camera和Image sensor技术基础笔记(2) -- Sensor的快门:全局快门(global shutter)和卷帘快门(rolling shutter)
  14. 4、day04利用XInput,在C/C++创建的窗口中读取键盘输入
  15. 从农民到“互联网+农牧业”老板 谈谈我的站长之路
  16. 【祥哥带你玩HoloLens开发】了解如何实现远程主机为HoloLens实时渲染
  17. 洛谷P1725 琪露诺
  18. UNR#2 梦中的题面 HDU6056
  19. 利用MyBatis实现CRUD操作
  20. Hyperledger Fabric国密改造

热门文章

  1. android视频拷到iphone6,苹果和安卓手机保存B站视频到U盘方法介绍
  2. N卡显卡驱动更新,解决色彩准确度增强的问题
  3. 没有域名能不能申请企业邮箱?
  4. 微信每天加多少人不会封号?(行业经验)
  5. 用户画像项目两大核心内容之一“one_id”(含SQL实现代码)
  6. python导入包如果找不到
  7. 怎么调整图片大小?这三种方法一定能帮到你
  8. BufferedImage修改图片大小
  9. python input隐藏输入_python输入input
  10. 力矩目标值 fTorque计算(伺服力矩控制模式)