企查查爬虫获取公司链接
import openpyxl
import requests # 模拟请求
import pandas as pd # 清洗数据
from bs4 import BeautifulSoup#打开目标execl,这里注意openpyxl能读取的execl后缀名是'.xlsx'文件
workbook1=openpyxl.load_workbook('xxx.xlsx')
#选定目标sheet
worksheet1 = workbook1.active
**# 请求头**
headers = {# 把xxxx 换成自己浏览器中参数信息"user-agent":"xxxxxx","referer": "xxxx","sec-fetch-mode": "xxxx","sec-fetch-site": "xxxx","cookie": "xxxx",
}
ko = []
**# 循环获取 B 列**
for cell in worksheet1['B']:# print(cell.value)# 路径url = 'https://www.qcc.com/web/search?key=' + cell.value# 模拟请求网页html_text = requests.get(url, headers=headers).textsoup = BeautifulSoup(html_text, 'html.parser')# 循环获取divfor ks in soup.find_all('div', {'class': 'maininfo'}):# print(ks.span.text)# 追加到ko数组 中ko.append([ks.span.text, ks.a['href']])# print(ks.a['href'])break
print(ko)
# 保存的标题
title = ['公司名称', '公司链接']
# 保存的数据
table = pd.DataFrame(ko, columns=title)
# 保存路径 如E:/xxxxx.xlsx 设置保存路径
table.to_excel('xxxx.xlsx', sheet_name='sheet1')
企查查爬虫获取公司链接相关推荐
- 企查查的批量公司查找
构建了企查查的查找公司的框架. 具体的excel导入文件名和导出文件名自己修改就行. import requests import bs4 import re from bs4 import Beau ...
- python 企查查爬虫_python爬虫另辟蹊径绕过企查查的登录验证,我太冇财了
从企查查爬取企业信息,如果没有登录直接检索,邮箱.电话都被隐藏了 点击详情,部分信息同样会被隐藏 毕竟只是打工的,没钱不能任性! 想要查看更完整的企业信息,只有登录了. 但登录需要滑块验证,有时可能还 ...
- python读取excel的公司名称信息,并爬虫获取公司的经营范围信息,回填到excel中
本文作者:是老王吖 原文链接:https://blog.csdn.net/jdkss/article/details/106077755?utm_source=app 1.项目需求 项目需求:这个问题 ...
- div中内容靠右_python读取excel的公司名称信息,并爬虫获取公司的经营范围信息,回填到excel中...
大家总说,python今天学明天忘,没有实际操作,想要知道哪里有练手的机会.其实你要善于发现问题,捕捉问题.不管是你看到文章中的一些案例,还是微信群友问的一个问题.你都需要仔细思考,如果是你做你应该怎 ...
- 企查查爬虫循环获取信息
思路:1.获取网址 设置请求头headers 2.循环拿到的excel中的数据模拟网页请求 3.数据解析 4.保存到excel中 爬取公司企业链接代码 https://qq_48989313/arti ...
- 企查查爬虫python实现(二)报错与细节
1.WebDriver object has no attribute find_element_by_xpath问题 重新安装selenium pip show selenium # 查看版本 新电 ...
- Python爬虫获取企查查公开的企业信息
1.参考博文 https://blog.csdn.net/qq_39295735/article/details/84504848?utm_medium=distribute.pc_relevant. ...
- 【mysql数据库】通过python 3.7 爬虫获取企查查公开的企业信息,并记录到数据库
1.爬虫的思路参考这篇博文 https://mp.csdn.net/postedit/83628587 2.数据库保存截图如下 3.python代码如下 #!/usr/bin/python3 #-*- ...
- Python爬虫:输入公司名称,爬取企查查网站中的公司信息
前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. 以下文章来源于Python爬虫数据分析挖掘 ,作者:李运辰 根据输入的公司名称来爬取企查查网 ...
最新文章
- Halcon中数据的四舍五入、取整、有效数字以及和字符串之间的转换
- [BZOJ2324][ZJOI2011][最小费用最大流]营救皮卡丘
- ContextMenuStrip 类
- php webserver documentroot,php – 在包含中使用$_SERVER [‘DOCUMENT_ROOT’]是个好主意?...
- 【C语言】(for循环嵌套)找出1000以内的水仙花数
- python中、print程序设计基础输出是_在python编程里, print 4> 2 and 1 and 4 输出的是什么?...
- Android中实现Activity的透明背景效果
- hadoop无法停止
- 例外被抛出且未被接住问题
- iis启动 服务无法在此时接受控制信息。 (异常来自 HRESULT:0x80070425)
- 学生端极域课堂万能密码
- 计算机房面积设置气消条件,广东省《建筑防烟排烟系统技术标准》问题释疑
- C语言中三个数比较大小详解——三种方法
- dw cs6 html建站点,dreamweaver cs6网页中制作锚点链接的教程方法
- IP-guard加密软件的攻防之路
- POJ3067 Japan
- 低功耗wifi可视门铃方案全球推广
- Android自定义输入法软键盘
- HRBU 2021暑期训练解题报告阶段二Day1
- 计算机会计综合作业,东财《会计信息系统》综合作业答卷
热门文章
- UPC 2020年夏混合个人训练第五十场【DEG】
- Vue项目上线后刷新报错404问题(apache,nginx,tomcat)
- 学角色建模好还是场景建模?5个角度分析,教你选择最合适的
- 判断点P是否在三角形ABC内
- 谈一谈post和get的区别
- Sql like模糊查询 区分大小写
- home为什么是地点副词_为什么home有副词的词性?
- 翻译Computer Relaying for Power Systems-2nd Edition(Arun G. Phadke, James S. Thorp)
- 输入文字后不会自动变长的下划线如何制作
- 某政府门户网站维护项目运维方案