企查查爬虫获取公司链接

import openpyxl
import requests  # 模拟请求
import pandas as pd  # 清洗数据
from bs4 import BeautifulSoup#打开目标execl，这里注意openpyxl能读取的execl后缀名是'.xlsx'文件
workbook1=openpyxl.load_workbook('xxx.xlsx')
#选定目标sheet
worksheet1 = workbook1.active
**# 请求头**
headers = {# 把xxxx 换成自己浏览器中参数信息"user-agent":"xxxxxx","referer": "xxxx","sec-fetch-mode": "xxxx","sec-fetch-site": "xxxx","cookie": "xxxx",
}
ko = []
**# 循环获取 B 列**
for cell in worksheet1['B']:# print(cell.value)# 路径url = 'https://www.qcc.com/web/search?key=' + cell.value# 模拟请求网页html_text = requests.get(url, headers=headers).textsoup = BeautifulSoup(html_text, 'html.parser')# 循环获取divfor ks in soup.find_all('div', {'class': 'maininfo'}):# print(ks.span.text)# 追加到ko数组 中ko.append([ks.span.text, ks.a['href']])# print(ks.a['href'])break
print(ko)
# 保存的标题
title = ['公司名称', '公司链接']
# 保存的数据
table = pd.DataFrame(ko, columns=title)
# 保存路径  如E:/xxxxx.xlsx  设置保存路径
table.to_excel('xxxx.xlsx', sheet_name='sheet1')

企查查爬虫获取公司链接相关推荐

企查查的批量公司查找
构建了企查查的查找公司的框架. 具体的excel导入文件名和导出文件名自己修改就行. import requests import bs4 import re from bs4 import Beau ...
python 企查查爬虫_python爬虫另辟蹊径绕过企查查的登录验证，我太冇财了
从企查查爬取企业信息,如果没有登录直接检索,邮箱.电话都被隐藏了点击详情,部分信息同样会被隐藏毕竟只是打工的,没钱不能任性! 想要查看更完整的企业信息,只有登录了. 但登录需要滑块验证,有时可能还 ...
python读取excel的公司名称信息，并爬虫获取公司的经营范围信息，回填到excel中
本文作者:是老王吖原文链接:https://blog.csdn.net/jdkss/article/details/106077755?utm_source=app 1.项目需求项目需求:这个问题 ...
div中内容靠右_python读取excel的公司名称信息，并爬虫获取公司的经营范围信息，回填到excel中...
大家总说,python今天学明天忘,没有实际操作,想要知道哪里有练手的机会.其实你要善于发现问题,捕捉问题.不管是你看到文章中的一些案例,还是微信群友问的一个问题.你都需要仔细思考,如果是你做你应该怎 ...
企查查爬虫循环获取信息
思路:1.获取网址设置请求头headers 2.循环拿到的excel中的数据模拟网页请求 3.数据解析 4.保存到excel中爬取公司企业链接代码 https://qq_48989313/arti ...
企查查爬虫python实现（二）报错与细节
1.WebDriver object has no attribute find_element_by_xpath问题重新安装selenium pip show selenium # 查看版本新电 ...
Python爬虫获取企查查公开的企业信息
1.参考博文 https://blog.csdn.net/qq_39295735/article/details/84504848?utm_medium=distribute.pc_relevant. ...
【mysql数据库】通过python 3.7 爬虫获取企查查公开的企业信息，并记录到数据库
1.爬虫的思路参考这篇博文 https://mp.csdn.net/postedit/83628587 2.数据库保存截图如下 3.python代码如下 #!/usr/bin/python3 #-*- ...
Python爬虫：输入公司名称，爬取企查查网站中的公司信息
前言本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. 以下文章来源于Python爬虫数据分析挖掘 ,作者:李运辰根据输入的公司名称来爬取企查查网 ...

企查查爬虫获取公司链接

企查查爬虫获取公司链接相关推荐

最新文章

热门文章