微信网站为http://weixin.sogou.com/

微信爬虫,使用代理服务器爬一个网址。注意设置代理服务器时,该代理服务器有可能失效,需要换成新的有效代理服务器。代理服务器可以百度到。

import urllib.request
import re
import time
import urllib.error# 自定义函数,功能为使用代理服务器爬一个网址
def use_proxy(proxy_addr, url):# 异常处理机制try:req = urllib.request.Request(url)  # Request模拟浏览器req.add_header = ('User-Agent', 'Mozilla/5.0 (Windows NT 10.0; …) Gecko/20100101 Firefox/63.0')proxy = urllib.request.ProxyHandler({'http': proxy_addr})  # 代理服务器opener = urllib.request.build_opener(proxy, urllib.request.HTTPHandler)urllib.request.install_opener(opener)data = urllib.request.urlopen(req).read()return dataexcept urllib.error.URLError as e:if hasattr(e, 'code'):  # 判断是否有状态码print(e.code)if hasattr(e, 'reason'):  # 判断是否有原因这个属性print(e.reason)# 若为URLError异常,延时10秒执行time.sleep(10)except Exception as e:print('exception:' + str(e))# 若为Exception异常,延时1秒执行time.sleep(1)# 设置关键词
key = 'Python'
# 设置代理服务器,该代理服务器有可能失效,读者需要换成新的有效代理服务器
proxy = '127.0.0.1:8888'
# 爬多少页
for i in range(0, 10):key = urllib.request.quote(key)thispageurl = 'https://weixin.sogou.com/weixin?query=' + key + '&type=2&page=' + str(i)thispagedata = use_proxy(proxy, thispageurl)pat1 = '<a target="_blank" href="(.*?)"'rs1 = re.compile(pat1, re.S).findall(str(thispagedata))if (len(rs1) == 0):print('此次(' + str(i) + '页)没成功')continuefor j in range(0, len(rs1)):thisurl = rs1[j]thisurl = thisurl.replace('amp;', '')file = 'e:/image/第' + str(i) + '页第' + str(j) + '篇文章.html'thisdata = use_proxy(proxy, thisurl)print(len(thisdata))try:fh = open(file, 'wb')fh.write(thisdata)fh.close()print('第' + str(i) + '页第' + str(j) + '篇文章成功')except Exception as e:print(e)print('第' + str(i) + '页第' + str(j) + '篇文章失败')

python微信爬虫相关推荐

  1. Python 微信爬虫完整实例【单线程与多线程】

    本文实例讲述了Python 实现的微信爬虫.分享给大家供大家参考,具体如下: 单线程版: import urllib.request import urllib.parse import urllib ...

  2. python 微信爬虫_python3简单实现微信爬虫

    使用ghost.py 通过搜搜 的微信搜索来爬取微信公共账号的信息 # -*- coding: utf-8 -*- import sys reload(sys) import datetime imp ...

  3. 如何利用Python网络爬虫爬取微信朋友圈动态--附代码(下)

    前天给大家分享了如何利用Python网络爬虫爬取微信朋友圈数据的上篇(理论篇),今天给大家分享一下代码实现(实战篇),接着上篇往下继续深入. 一.代码实现 1.修改Scrapy项目中的items.py ...

  4. python朋友圈动态_如何利用Python网络爬虫爬取微信朋友圈动态--附代码(下)

    前天给大家分享了如何利用Python网络爬虫爬取微信朋友圈数据的上篇(理论篇),今天给大家分享一下代码实现(实战篇),接着上篇往下继续深入. 一.代码实现 1.修改Scrapy项目中的items.py ...

  5. python展示全部好友_利用Python网络爬虫抓取微信好友的签名及其可视化展示

    前几天给大家分享了如何利用Python词云和wordart可视化工具对朋友圈数据进行可视化,利用Python网络爬虫抓取微信好友数量以及微信好友的男女比例,以及利用Python网络爬虫抓取微信好友的所 ...

  6. python抓取朋友圈动态_如何利用Python网络爬虫爬取微信朋友圈动态--附代码(下)...

    原标题:如何利用Python网络爬虫爬取微信朋友圈动态--附代码(下) 前天给大家分享了如何利用Python网络爬虫爬取微信朋友圈数据的上篇(理论篇),今天给大家分享一下代码实现(实战篇),接着上篇往 ...

  7. python爬虫微信朋友圈怎么发文字_如何利用Python网络爬虫抓取微信朋友圈的动态(上)...

    今天小编给大家分享一下如何利用Python网络爬虫抓取微信朋友圈的动态信息,实际上如果单独的去爬取朋友圈的话,难度会非常大,因为微信没有提供向网易云音乐这样的API接口,所以很容易找不到门.不过不要慌 ...

  8. python爬虫好友聊天记录_利用Python网络爬虫抓取微信好友的签名及其可视化展示...

    前几天给大家分享了如何利用Python词云和wordart可视化工具对朋友圈数据进行可视化,利用Python网络爬虫抓取微信好友数量以及微信好友的男女比例,以及利用Python网络爬虫抓取微信好友的所 ...

  9. python抓取微信朋友圈动态_2018最全如何利用Python网络爬虫抓取微信朋友圈的动态...

    今天小编给大家分享一下如何利用Python网络爬虫抓取微信朋友圈的动态信息,实际上如果单独的去爬取朋友圈的话,难度会非常大,因为微信没有提供向网易云音乐这样的API接口,所以很容易找不到门.不过不要慌 ...

  10. python爬虫能爬取微信密码吗_如何利用Python网络爬虫抓取微信好友数量以及微信好友的男女比例...

    今天我们继续focus on微信,不过这次给大家带来的是利用Python网络爬虫抓取微信好友总数量和微信好友男女性别的分布情况.代码实现蛮简单的,具体的教程如下. 相信大家都知道,直接通过网页抓取微信 ...

最新文章

  1. 有没有什么高效「炼丹」神器可以推荐?复旦fastNLP团队祭出内部调参利器fitlog...
  2. openfiler 工具栏和快捷方式
  3. java HashMap的使用
  4. appium环境搭建参考
  5. 2009.09.01 博客近期改进公告!
  6. springboot @JsonSerialize 的使用
  7. “阿里味” PUA 编程语言火上GitHub热榜,标星2.7K!
  8. 分布式系统之消息队列
  9. 如何将vue项目打包为.apk文件
  10. 两边双虚线是什么意思_行星减速机生产厂家解析行星减速机双支撑与单支撑
  11. 集团公司(嵌入ETL工具)财务报表系统解决方案
  12. SaltStack 拉取和推送文件
  13. 各种数据集汇总——转载而来
  14. 1075:字符串统计
  15. 每日学点python之六(列表与元组)
  16. Debian 8 麦克风无声音的解决过程
  17. 2019领克车展 Max Co币机诞生记
  18. 高3米直径10的半圆形求面积是多少
  19. 关于大数据,需要你读懂的10个小故事
  20. 使用MobileViT替换YOLOv5主干网络

热门文章

  1. 软件体系结构期末复习总结
  2. 多线程抓取链家网数据
  3. Emu8086下载和注册
  4. 下载elasticsearch的jdbc包
  5. Training ICD Basics摘要
  6. 预备篇:一.元器件选型及飞控电路设计
  7. Elasticsearch添加拼音搜索支持
  8. Java区块链视频教程百度云_JAVA区块链项目实战视频课程区块链入门与去中心化应用实战视频课程网盘下载...
  9. 16QAM调制解调和误码率
  10. oracle asm文件查找,Oracle ASM 文件管理