python爬虫微博粉丝数据_Python爬虫：微博粉丝列表

importrequestsimportre

tmpt_url= 'https://weibo.com/p/1005051678105910/follow?page=%d#Pl_Official_HisRelation__59'

defget_data(tmpt_url):

urllist= [tmpt_url%i for i in range(1,6)]

user_id= [] #粉丝ID

user_name = [] #粉丝名称

user_follow = [] #粉丝的关注

user_fans = [] #粉丝的粉丝量

user_address = [] #粉丝的地址

headers= {'Accept':'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8','Accept-Encoding':'gzip, deflate, br','Accept-Language':'zh-CN,zh;q=0.8,zh-TW;q=0.7,zh-HK;q=0.5,en-US;q=0.3,en;q=0.2','Connection':'keep-alive','Cookie':'请在自己的浏览器中查看，因涉及个人隐私不公开','Host':'weibo.com','Upgrade-Insecure-Requests':'1','User-Agent':'Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:65.0) Gecko/20100101 Firefox/65.0'}for url inurllist:

html= requests.get(url,headers=headers).text

user_id.extend(re.findall(r'\S+',html))

user_name.extend(re.findall(r'(\S+)',html))

user_follow.extend(re.findall(r'关注 (\d+)',html))

user_fans.extend(re.findall(r'粉丝(\d+)',html))

user_address.extend(re.findall(r'地址(\S+\s?\S+?)\\r\\n\\t\\t\\t\\t\\t',html))print('user_id',user_id)print('user_name',user_name)print('user_follow',user_follow)print('user_fans',user_fans)print('user_address',user_address)

python爬虫微博粉丝数据_Python爬虫：微博粉丝列表相关推荐

python爬视频网站数据_python爬虫基础应用----爬取无反爬视频网站
一.爬虫简单介绍爬虫是什么? 爬虫是首先使用模拟浏览器访问网站获取数据,然后通过解析过滤获得有价值的信息,最后保存到到自己库中的程序. 爬虫程序包括哪些模块? python中的爬虫程序主要包括,re ...
python抓取数据库数据_Python爬虫抓取东方财富网股票数据并实现MySQL数据库存储...
Python爬虫可以说是好玩又好用了.现想利用Python爬取网页股票数据保存到本地csv数据文件中,同时想把股票数据保存到MySQL数据库中.需求有了,剩下的就是实现了. 在开始之前,保证已经安装好 ...
python爬虫实时更新数据_Python爬虫更新中
基础一.环境配置查看已安装的包 pip freeze 导出 pip freeze >requirements.txt 安装 pip install -r requirements.txt - ...
python代码html显示数据_Python爬虫基础之认识html和学习数据提取（上）
我:我已经学会了基本的python,接下来可以学什么鸭? 惨绿青年:接下来可以学习制作python爬虫了,但还是需要学习相关的知识. 我:什么知识鸭? 惨绿青年:网页的相关知识.我们看到的网页一般是h ...
python爬虫和医学数据_Python爬虫入门教程 24-100 微医挂号网医生数据抓取
1. 微医挂号网医生数据写在前面今天要抓取的一个网站叫做微医网站,地址为 https://www.guahao.com ,我们将通过python3爬虫抓取这个网址,然后数据存储到CSV里面,为后面的 ...
python爬虫xpath提取数据_python爬虫三大解析库之XPath解析库通俗易懂详讲
@(这里写自定义目录标题) 使用XPath解析库 1.简介 ??XPath(全称XML Path Languang),即XML路径语言,是一种在XML文档中查找信息的语言.适用于XML和HTML文档的 ...
python爬取flash数据_python爬虫: 爬取flash播放页面的信息
我们通过查看知道flash类型的网页采取文件格式是amf类型的 AMF(Action Message Format) 是Flash与服务端通信的一种常见的二进制编码模式,其传输效率高,可以在HTTP层 ...
python采集直播间数据_Python 爬虫进阶必备 | 某直播数据分析平台加密参数 sign 分析...
今日网站 aHR0cHMlM0EvL3d3dy5ocmRqeXVuLmNvbS8lM0YlMjMvYW5jaG9yTGlzdA== 被催更了,最近临近特殊时期,所以比较忙,趁着晚上有空来一发. 抓包分 ...
python爬虫xpath提取数据_python爬虫的页面数据解析和提取/xpath/bs4/jsonpath/正则(1)...
The Dormouse's story Once upon a time there were three little sisters; and their names were , Lacie ...

python爬虫微博粉丝数据_Python爬虫：微博粉丝列表

python爬虫微博粉丝数据_Python爬虫：微博粉丝列表相关推荐

最新文章

热门文章