爬取上市公司第一大股东持股比例
1.目标
获取给定上市股票、给定年分的第一大股东持股比例,如下图所示:
- 分析xhr请求
查看payload
需要三个参数,但是非常简单哈,contenttype
、jzrq
非常简单,主要是stockid
为什么不是我们熟悉的六位的股票代码呢?
在网站上看到股票代码的页面如下:
从上面的网页源代码中,可以找到对应的stockid
- 将请求转化为
python
代码
import requests,reheaders = {'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.7','Accept-Language': 'zh-CN,zh;q=0.9,en;q=0.8','Connection': 'keep-alive','Referer': 'https://quote.cfi.cn/quote.aspx?actstockid=7&actcontenttype=gdtj&client=pc&searchcode=','Sec-Fetch-Dest': 'document','Sec-Fetch-Mode': 'navigate','Sec-Fetch-Site': 'same-origin','Sec-Fetch-User': '?1','Upgrade-Insecure-Requests': '1','User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/111.0.0.0 Safari/537.36','sec-ch-ua': '"Google Chrome";v="111", "Not(A:Brand";v="8", "Chromium";v="111"','sec-ch-ua-mobile': '?0','sec-ch-ua-platform': '"Windows"',
}def getTable(stockid,jzrq):params = {'stockid': stockid,'contenttype': 'gdtj','jzrq': jzrq,}response = requests.get('https://quote.cfi.cn/quote.aspx', params=params, headers=headers)return response.textdef reg_find(text):"""</td><td>23.67%</td><td>"""anss = re.findall(r'</td><td>([\d|\.]*)%</td><td>',text)if len(anss) == 0:print("error")exit(0)return anss[0]def id2stkid(uid):params = {'t': '12',}response = requests.get('https://quote.cfi.cn/stockList.aspx', params=params, headers=headers)ans = re.findall(rf"οnclick=\"stock_clickFunc\((\d+),\'{uid}\'\)",response.text)return ansif __name__ == "__main__":codes = ['000001','000002','000008']for i in codes:ncode = id2stkid(i)text = getTable(ncode,'2020-06-30')ans = reg_find(text)print(ans)
- 运行截图
爬取上市公司第一大股东持股比例相关推荐
- 中财网爬取上市公司第一大股东持股比例
1.目标 在中财网(https://www.cfi.cn/) 获取给定上市股票.给定年分的第一大股东持股比例,如下图所示: 分析xhr请求 查看payload需要三个参数,但是非常简单哈,conten ...
- python爬取上市公司套期保值公告(巨潮网)--使用Selenium方法
python爬虫爬取上市公司套期保值公告(巨潮网) 摘要 巨潮资讯网的网页是通过JavaScript动态加载的,因此本文利用Selenium方法爬取该网站上市公司的套期保值公告. 主要技术路线: 1. ...
- 爬取上市公司财务数据
python爬取上市公司财务数据 爬取入口 http://data.eastmoney.com/bbsj/201112/yjbb.html 使用selenium进行爬取的,本来参考其他博主的代码,但是 ...
- 【爬虫】使用beautifulsoup、requests爬取网页上的图片;循环爬取上市公司高管信息
**声明:本篇博文只用于对于爬虫技术的学习交流.如果侵犯到相关网站利益,请联系我删除博文.造成不便还请见谅.希望各位同学在学习的时候不要过于频繁的去请求. 最近博主在学习前端开发和网页相关的东西,这些 ...
- php批量爬取上市公司高管持股变动信息
php批量爬取上市公司高管持股变动信息 用php的爬虫功能 批量爬取上市公司高管的持股信息,我们只需要知道最近一年的持股变动,还需要知道有几位高管持股有变动,人数越多,才说明这个变动和公司的发展是高度 ...
- selenium爬取上市公司全部行业及分行业股票行情数据
上次制作了输入股票代码,显示股票行情.历史数据.股评词云图的网页,但是,想要判断一只股票的投资价值仅看它自己的历史走势是不够的,还要与其他个股尤其是同行业个股进行比较.当然,行业轮动时选对行业是投资成 ...
- 雪球网爬取上市公司信息(一):爬取上市公司代号
条件:有一批5g相关公司,只知道公司名字或是简称,不知道公司是否上市以及股票代码,需要爬取公司信息. 网站:雪球网 思路:上传关键字,爬取搜索结果网页,将有结果的公司信息抓取下来并存入数据库 1.在雪 ...
- 用Python爬取上市公司数据、分析数据
前言 在很多网站上,都会以表格的形式展示数据,而我们获取这种数据只需通过十几行爬虫代码就可以搞定,轻松搞定网页爬虫,实现高效办公 知识点: 爬虫基本原理 requests的简单使用 pandas库 p ...
- python财务报表分析-用Python爬取东方财富网上市公司财务报表
♚ 作者:苏克,零基础.转行python爬虫与数据分析 博客:https://www.makcyun.top 摘要: 现在很多网页都采取JavaScript进行动态渲染,其中包括Ajax技术.有的网页 ...
最新文章
- sql 纵向求和_sql列统计求和
- 小撸 array map 源码
- C# 字符串操作学习总结
- Python enumerate() 函数
- MySQL的chap服务器_chap01 初涉MySQL
- QTP中实现对文本文件(txt)的读写操作
- Linux里sra文件是什么,prefetch命令下载SRA文件
- 生成对抗网络GAN损失函数loss的简单理解
- Q115:Linux系统下CodeBlocks对PBRT-V3进行编译和调试
- android studio运行项目快捷键,Android Studio 快捷键大全
- java overload_java之方法重载(overload)
- MySql 查询比其中某一位讲师工资少的教师姓名、工资和职称
- 英语听说计算机查分,2019北京中考英语听说考怎么查分?附一键查询入口
- Dynamic CRM9.0 环境安装部署手册步骤和遇到的一些问题解决方案(包含ADFS部署)
- C++ Primer Plus (第六版)编程练习记录(chapter7)
- 2020Android开发常用的开源框架、开源库
- Python实现ABC人工蜂群优化算法优化支持向量机分类模型(SVC算法)项目实战
- 长期出差补助减半,这谁还愿意出差啊
- 浏览器 看不到请求了
- Linux Rsync 安装和配置
热门文章
- 【Unity实用小知识点】实现按钮长按功能(用EventTrigger实现)
- thinkpad X240 安装Ubuntu14.04 系统并搭建android开发环境
- 读梁实秋散文《旅行》有感
- 数量乘单价秋金额的计算机公式,“excle函数公式 数量乘单价“Excel表格中,总计栏怎么设置每一行的数量乘以金额的总和?求公式...
- js声明函数的几种方式
- C/C++ 绝对值【简单易懂,代码可以直接运行】
- java抽取公共方法的诀窍_Web服务编程技巧和窍门,Java应用程序的旧式集成技术...
- 实用版ChatBing论文阅读助手教程+新测评
- springboot第6集:PO、VO、DAO、BO、DTO、POJO 能分清吗?
- 不扎心了,老铁!三星量子点显示器看片更清晰