importrequestsimportre

tmpt_url= 'https://weibo.com/p/1005051678105910/follow?page=%d#Pl_Official_HisRelation__59'

defget_data(tmpt_url):

urllist= [tmpt_url%i for i in range(1,6)]

user_id= [] #粉丝ID

user_name = [] #粉丝名称

user_follow = [] #粉丝的关注

user_fans = [] #粉丝的粉丝量

user_address = [] #粉丝的地址

headers= {'Accept':'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8','Accept-Encoding':'gzip, deflate, br','Accept-Language':'zh-CN,zh;q=0.8,zh-TW;q=0.7,zh-HK;q=0.5,en-US;q=0.3,en;q=0.2','Connection':'keep-alive','Cookie':'请在自己的浏览器中查看,因涉及个人隐私不公开','Host':'weibo.com','Upgrade-Insecure-Requests':'1','User-Agent':'Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:65.0) Gecko/20100101 Firefox/65.0'}for url inurllist:

html= requests.get(url,headers=headers).text

user_id.extend(re.findall(r'\S+',html))

user_name.extend(re.findall(r'(\S+)',html))

user_follow.extend(re.findall(r'关注 (\d+)',html))

user_fans.extend(re.findall(r'粉丝(\d+)',html))

user_address.extend(re.findall(r'地址(\S+\s?\S+?)\\r\\n\\t\\t\\t\\t\\t',html))print('user_id',user_id)print('user_name',user_name)print('user_follow',user_follow)print('user_fans',user_fans)print('user_address',user_address)

python爬虫微博粉丝数据_Python爬虫:微博粉丝列表相关推荐

  1. python爬视频网站数据_python爬虫基础应用----爬取无反爬视频网站

    一.爬虫简单介绍 爬虫是什么? 爬虫是首先使用模拟浏览器访问网站获取数据,然后通过解析过滤获得有价值的信息,最后保存到到自己库中的程序. 爬虫程序包括哪些模块? python中的爬虫程序主要包括,re ...

  2. python抓取数据库数据_Python爬虫抓取东方财富网股票数据并实现MySQL数据库存储...

    Python爬虫可以说是好玩又好用了.现想利用Python爬取网页股票数据保存到本地csv数据文件中,同时想把股票数据保存到MySQL数据库中.需求有了,剩下的就是实现了. 在开始之前,保证已经安装好 ...

  3. python爬虫实时更新数据_Python爬虫 更新中

    基础 一.环境配置 查看已安装的包 pip freeze 导出 pip freeze >requirements.txt 安装 pip install -r requirements.txt - ...

  4. python代码html显示数据_Python爬虫基础之认识html和学习数据提取(上)

    我:我已经学会了基本的python,接下来可以学什么鸭? 惨绿青年:接下来可以学习制作python爬虫了,但还是需要学习相关的知识. 我:什么知识鸭? 惨绿青年:网页的相关知识.我们看到的网页一般是h ...

  5. python爬虫和医学数据_Python爬虫入门教程 24-100 微医挂号网医生数据抓取

    1. 微医挂号网医生数据写在前面 今天要抓取的一个网站叫做微医网站,地址为 https://www.guahao.com ,我们将通过python3爬虫抓取这个网址,然后数据存储到CSV里面,为后面的 ...

  6. python爬虫xpath提取数据_python爬虫三大解析库之XPath解析库通俗易懂详讲

    @(这里写自定义目录标题) 使用XPath解析库 1.简介 ??XPath(全称XML Path Languang),即XML路径语言,是一种在XML文档中查找信息的语言.适用于XML和HTML文档的 ...

  7. python爬取flash数据_python爬虫: 爬取flash播放页面的信息

    我们通过查看知道flash类型的网页采取文件格式是amf类型的 AMF(Action Message Format) 是Flash与服务端通信的一种常见的二进制编码模式,其传输效率高,可以在HTTP层 ...

  8. python采集直播间数据_Python 爬虫进阶必备 | 某直播数据分析平台加密参数 sign 分析...

    今日网站 aHR0cHMlM0EvL3d3dy5ocmRqeXVuLmNvbS8lM0YlMjMvYW5jaG9yTGlzdA== 被催更了,最近临近特殊时期,所以比较忙,趁着晚上有空来一发. 抓包分 ...

  9. python爬虫xpath提取数据_python爬虫的页面数据解析和提取/xpath/bs4/jsonpath/正则(1)...

    The Dormouse's story Once upon a time there were three little sisters; and their names were , Lacie ...

最新文章

  1. c++ 负数比较大小_负数的定义(二)
  2. JMS学习(2):ActiveMQ简单介绍以及安装
  3. 休眠:在sqlRestriction上使用联接表别名
  4. centos tar安装mysql_centos系统通过tar.gz包安装mysql5.7.19
  5. 人类心理学中几乎没有人知道的东西是什么?
  6. PostgreSQL相关知识概念
  7. ajax多选下拉,模拟select下拉框之多选(数据源采用模拟Ajax数据--原创)(示例代码)...
  8. mysql 查询 in memory_In-Memory整体汇总
  9. Vlc之vs2010版本的配置
  10. python控制台清屏_python清屏命令
  11. 《暗时间》时间管理法则
  12. C4D的几大主流渲染器!看完你就知道选择学习哪款了
  13. 云上PDF怎么删除页眉页脚_PDF怎么删除页面?
  14. Photoshop学习心得
  15. 案例驱动python编程入门-郑州高薪python全栈工程师
  16. SocialBook帮你扫除网红营销乱象
  17. TCP协议--复位报文段
  18. 图注意力网络(GAT)
  19. 台湾印象: 太平洋的风
  20. 【机器人学】冗余七自由度机械臂的解析解逆解算法

热门文章

  1. 四度上榜!中睿天下入选《CCSIP 2022中国网络安全产业全景图》8大领域
  2. 微波网络散射参数测量
  3. 抛物线的瞄准线的绘制! Cocos Creator!
  4. PC网站微信扫码支付之Native支付(模式二)
  5. 简洁表格简历模板-Word简历可编辑下载
  6. 织梦修改或删除默认管理员admin
  7. piwik安装和基本使用
  8. java读取藏文_藏文热点词处理系统(java+xml)附源码
  9. 网络安全工程师(白帽子)前景分析+学习成长路线,超多思维导图从零到整,看完这篇就够了。
  10. kubernetes-ETCD