1.目标

获取给定上市股票、给定年分的第一大股东持股比例,如下图所示:

  • 分析xhr请求

查看payload需要三个参数,但是非常简单哈,contenttypejzrq非常简单,主要是stockid为什么不是我们熟悉的六位的股票代码呢?

在网站上看到股票代码的页面如下:

从上面的网页源代码中,可以找到对应的stockid

  • 将请求转化为python代码
import requests,reheaders = {'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.7','Accept-Language': 'zh-CN,zh;q=0.9,en;q=0.8','Connection': 'keep-alive','Referer': 'https://quote.cfi.cn/quote.aspx?actstockid=7&actcontenttype=gdtj&client=pc&searchcode=','Sec-Fetch-Dest': 'document','Sec-Fetch-Mode': 'navigate','Sec-Fetch-Site': 'same-origin','Sec-Fetch-User': '?1','Upgrade-Insecure-Requests': '1','User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/111.0.0.0 Safari/537.36','sec-ch-ua': '"Google Chrome";v="111", "Not(A:Brand";v="8", "Chromium";v="111"','sec-ch-ua-mobile': '?0','sec-ch-ua-platform': '"Windows"',
}def getTable(stockid,jzrq):params = {'stockid': stockid,'contenttype': 'gdtj','jzrq': jzrq,}response = requests.get('https://quote.cfi.cn/quote.aspx', params=params, headers=headers)return response.textdef reg_find(text):"""</td><td>23.67%</td><td>"""anss = re.findall(r'</td><td>([\d|\.]*)%</td><td>',text)if len(anss) == 0:print("error")exit(0)return anss[0]def id2stkid(uid):params = {'t': '12',}response = requests.get('https://quote.cfi.cn/stockList.aspx', params=params, headers=headers)ans = re.findall(rf"οnclick=\"stock_clickFunc\((\d+),\'{uid}\'\)",response.text)return ansif __name__ == "__main__":codes = ['000001','000002','000008']for i in codes:ncode = id2stkid(i)text = getTable(ncode,'2020-06-30')ans = reg_find(text)print(ans)
  • 运行截图

爬取上市公司第一大股东持股比例相关推荐

  1. 中财网爬取上市公司第一大股东持股比例

    1.目标 在中财网(https://www.cfi.cn/) 获取给定上市股票.给定年分的第一大股东持股比例,如下图所示: 分析xhr请求 查看payload需要三个参数,但是非常简单哈,conten ...

  2. python爬取上市公司套期保值公告(巨潮网)--使用Selenium方法

    python爬虫爬取上市公司套期保值公告(巨潮网) 摘要 巨潮资讯网的网页是通过JavaScript动态加载的,因此本文利用Selenium方法爬取该网站上市公司的套期保值公告. 主要技术路线: 1. ...

  3. 爬取上市公司财务数据

    python爬取上市公司财务数据 爬取入口 http://data.eastmoney.com/bbsj/201112/yjbb.html 使用selenium进行爬取的,本来参考其他博主的代码,但是 ...

  4. 【爬虫】使用beautifulsoup、requests爬取网页上的图片;循环爬取上市公司高管信息

    **声明:本篇博文只用于对于爬虫技术的学习交流.如果侵犯到相关网站利益,请联系我删除博文.造成不便还请见谅.希望各位同学在学习的时候不要过于频繁的去请求. 最近博主在学习前端开发和网页相关的东西,这些 ...

  5. php批量爬取上市公司高管持股变动信息

    php批量爬取上市公司高管持股变动信息 用php的爬虫功能 批量爬取上市公司高管的持股信息,我们只需要知道最近一年的持股变动,还需要知道有几位高管持股有变动,人数越多,才说明这个变动和公司的发展是高度 ...

  6. selenium爬取上市公司全部行业及分行业股票行情数据

    上次制作了输入股票代码,显示股票行情.历史数据.股评词云图的网页,但是,想要判断一只股票的投资价值仅看它自己的历史走势是不够的,还要与其他个股尤其是同行业个股进行比较.当然,行业轮动时选对行业是投资成 ...

  7. 雪球网爬取上市公司信息(一):爬取上市公司代号

    条件:有一批5g相关公司,只知道公司名字或是简称,不知道公司是否上市以及股票代码,需要爬取公司信息. 网站:雪球网 思路:上传关键字,爬取搜索结果网页,将有结果的公司信息抓取下来并存入数据库 1.在雪 ...

  8. 用Python爬取上市公司数据、分析数据

    前言 在很多网站上,都会以表格的形式展示数据,而我们获取这种数据只需通过十几行爬虫代码就可以搞定,轻松搞定网页爬虫,实现高效办公 知识点: 爬虫基本原理 requests的简单使用 pandas库 p ...

  9. python财务报表分析-用Python爬取东方财富网上市公司财务报表

    ♚ 作者:苏克,零基础.转行python爬虫与数据分析 博客:https://www.makcyun.top 摘要: 现在很多网页都采取JavaScript进行动态渲染,其中包括Ajax技术.有的网页 ...

最新文章

  1. sql 纵向求和_sql列统计求和
  2. 小撸 array map 源码
  3. C# 字符串操作学习总结
  4. Python enumerate() 函数
  5. MySQL的chap服务器_chap01 初涉MySQL
  6. QTP中实现对文本文件(txt)的读写操作
  7. Linux里sra文件是什么,prefetch命令下载SRA文件
  8. 生成对抗网络GAN损失函数loss的简单理解
  9. Q115:Linux系统下CodeBlocks对PBRT-V3进行编译和调试
  10. android studio运行项目快捷键,Android Studio 快捷键大全
  11. java overload_java之方法重载(overload)
  12. MySql 查询比其中某一位讲师工资少的教师姓名、工资和职称
  13. 英语听说计算机查分,2019北京中考英语听说考怎么查分?附一键查询入口
  14. Dynamic CRM9.0 环境安装部署手册步骤和遇到的一些问题解决方案(包含ADFS部署)
  15. C++ Primer Plus (第六版)编程练习记录(chapter7)
  16. 2020Android开发常用的开源框架、开源库
  17. Python实现ABC人工蜂群优化算法优化支持向量机分类模型(SVC算法)项目实战
  18. 长期出差补助减半,这谁还愿意出差啊
  19. 浏览器 看不到请求了
  20. Linux Rsync 安装和配置

热门文章

  1. 【Unity实用小知识点】实现按钮长按功能(用EventTrigger实现)
  2. thinkpad X240 安装Ubuntu14.04 系统并搭建android开发环境
  3. 读梁实秋散文《旅行》有感
  4. 数量乘单价秋金额的计算机公式,“excle函数公式 数量乘单价“Excel表格中,总计栏怎么设置每一行的数量乘以金额的总和?求公式...
  5. js声明函数的几种方式
  6. C/C++ 绝对值【简单易懂,代码可以直接运行】
  7. java抽取公共方法的诀窍_Web服务编程技巧和窍门,Java应用程序的旧式集成技术...
  8. 实用版ChatBing论文阅读助手教程+新测评
  9. springboot第6集:PO、VO、DAO、BO、DTO、POJO 能分清吗?
  10. 不扎心了,老铁!三星量子点显示器看片更清晰