import openpyxl
import requests  # 模拟请求
import pandas as pd  # 清洗数据
from bs4 import BeautifulSoup#打开目标execl,这里注意openpyxl能读取的execl后缀名是'.xlsx'文件
workbook1=openpyxl.load_workbook('xxx.xlsx')
#选定目标sheet
worksheet1 = workbook1.active
**# 请求头**
headers = {# 把xxxx 换成自己浏览器中参数信息"user-agent":"xxxxxx","referer": "xxxx","sec-fetch-mode": "xxxx","sec-fetch-site": "xxxx","cookie": "xxxx",
}
ko = []
**# 循环获取 B 列**
for cell in worksheet1['B']:# print(cell.value)# 路径url = 'https://www.qcc.com/web/search?key=' + cell.value# 模拟请求网页html_text = requests.get(url, headers=headers).textsoup = BeautifulSoup(html_text, 'html.parser')# 循环获取divfor ks in soup.find_all('div', {'class': 'maininfo'}):# print(ks.span.text)# 追加到ko数组 中ko.append([ks.span.text, ks.a['href']])# print(ks.a['href'])break
print(ko)
# 保存的标题
title = ['公司名称', '公司链接']
# 保存的数据
table = pd.DataFrame(ko, columns=title)
# 保存路径  如E:/xxxxx.xlsx  设置保存路径
table.to_excel('xxxx.xlsx', sheet_name='sheet1')

企查查爬虫获取公司链接相关推荐

  1. 企查查的批量公司查找

    构建了企查查的查找公司的框架. 具体的excel导入文件名和导出文件名自己修改就行. import requests import bs4 import re from bs4 import Beau ...

  2. python 企查查爬虫_python爬虫另辟蹊径绕过企查查的登录验证,我太冇财了

    从企查查爬取企业信息,如果没有登录直接检索,邮箱.电话都被隐藏了 点击详情,部分信息同样会被隐藏 毕竟只是打工的,没钱不能任性! 想要查看更完整的企业信息,只有登录了. 但登录需要滑块验证,有时可能还 ...

  3. python读取excel的公司名称信息,并爬虫获取公司的经营范围信息,回填到excel中

    本文作者:是老王吖 原文链接:https://blog.csdn.net/jdkss/article/details/106077755?utm_source=app 1.项目需求 项目需求:这个问题 ...

  4. div中内容靠右_python读取excel的公司名称信息,并爬虫获取公司的经营范围信息,回填到excel中...

    大家总说,python今天学明天忘,没有实际操作,想要知道哪里有练手的机会.其实你要善于发现问题,捕捉问题.不管是你看到文章中的一些案例,还是微信群友问的一个问题.你都需要仔细思考,如果是你做你应该怎 ...

  5. 企查查爬虫循环获取信息

    思路:1.获取网址 设置请求头headers 2.循环拿到的excel中的数据模拟网页请求 3.数据解析 4.保存到excel中 爬取公司企业链接代码 https://qq_48989313/arti ...

  6. 企查查爬虫python实现(二)报错与细节

    1.WebDriver object has no attribute find_element_by_xpath问题 重新安装selenium pip show selenium # 查看版本 新电 ...

  7. Python爬虫获取企查查公开的企业信息

    1.参考博文 https://blog.csdn.net/qq_39295735/article/details/84504848?utm_medium=distribute.pc_relevant. ...

  8. 【mysql数据库】通过python 3.7 爬虫获取企查查公开的企业信息,并记录到数据库

    1.爬虫的思路参考这篇博文 https://mp.csdn.net/postedit/83628587 2.数据库保存截图如下 3.python代码如下 #!/usr/bin/python3 #-*- ...

  9. Python爬虫:输入公司名称,爬取企查查网站中的公司信息

    前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. 以下文章来源于Python爬虫数据分析挖掘 ,作者:李运辰 根据输入的公司名称来爬取企查查网 ...

最新文章

  1. Halcon中数据的四舍五入、取整、有效数字以及和字符串之间的转换
  2. [BZOJ2324][ZJOI2011][最小费用最大流]营救皮卡丘
  3. ContextMenuStrip 类
  4. php webserver documentroot,php – 在包含中使用$_SERVER [‘DOCUMENT_ROOT’]是个好主意?...
  5. 【C语言】(for循环嵌套)找出1000以内的水仙花数
  6. python中、print程序设计基础输出是_在python编程里, print 4> 2 and 1 and 4 输出的是什么?...
  7. Android中实现Activity的透明背景效果
  8. hadoop无法停止
  9. 例外被抛出且未被接住问题
  10. iis启动 服务无法在此时接受控制信息。 (异常来自 HRESULT:0x80070425)
  11. 学生端极域课堂万能密码
  12. 计算机房面积设置气消条件,广东省《建筑防烟排烟系统技术标准》问题释疑
  13. C语言中三个数比较大小详解——三种方法
  14. dw cs6 html建站点,dreamweaver cs6网页中制作锚点链接的教程方法
  15. IP-guard加密软件的攻防之路
  16. POJ3067 Japan
  17. 低功耗wifi可视门铃方案全球推广
  18. Android自定义输入法软键盘
  19. HRBU 2021暑期训练解题报告阶段二Day1
  20. 计算机会计综合作业,东财《会计信息系统》综合作业答卷

热门文章

  1. UPC 2020年夏混合个人训练第五十场【DEG】
  2. Vue项目上线后刷新报错404问题(apache,nginx,tomcat)
  3. 学角色建模好还是场景建模?5个角度分析,教你选择最合适的
  4. 判断点P是否在三角形ABC内
  5. 谈一谈post和get的区别
  6. Sql like模糊查询 区分大小写
  7. home为什么是地点副词_为什么home有副词的词性?
  8. 翻译Computer Relaying for Power Systems-2nd Edition(Arun G. Phadke, James S. Thorp)
  9. 输入文字后不会自动变长的下划线如何制作
  10. 某政府门户网站维护项目运维方案