本文介绍基于Python3+通过调用新浪微博API方式采集用户信息的案例。

1.前期准备

  • 编程语言:Python3.0+
  • 下载库:sinaweibopy3
  • 编辑软件:Spyder

2.获取微博授权

进入http://open.weibo.com/apps/new?sort=web获取App Key以及App Secret。具体方法如下:

2.1 创建应用

如图点击,微链接—>网站接入—>立即接入

设置应用名称和应用分类,其中应用分类选择网页应用

2.2 获取App Key等

创建完成后,即进入到应用中,随后在基本信息中获取App Key以及App Secret两个关键代码。

高级信息中,点击OAuth2.0,选择编辑

均填入:https://api.weibo.com/oauth2/default.html

3.编写程序

启动Spyder,随后将测试代码粘贴进来。

3.1 导入库

import webbrowser
import sinaweibopy3

这里需要注意的是sinaweibopy3库已经下载到和你当前程序在同一目录下,如下图所示:

而 webbrowser库为Python3.0+自带库,无需安装。

3.2 参数设置

APP_KEY = 'XXXXXXXXXXXXXXX'
APP_SECRET = 'XXXXXXXXXXXXXXXXXXXXXXXX'
REDIRECT_URL = 'XXXXXXXXXXXXXXXXXXXXXXXXXXX'

这里填入刚才申请下来的专属代码【2.2小节】,用于识别应用。

3.3 通过验证生成URL

client = sinaweibopy3.APIClient(app_key=APP_KEY, app_secret=APP_SECRET, redirect_uri=REDIRECT_URL)
url = client.get_authorize_url()
webbrowser.open_new(url)
result = client.request_access_token(
input("please input code : "))
print(result)
client.set_access_token(result.access_token, result.expires_in)

运行到此时,会调用浏览器弹出授权页面,点击授权后会转到默认页面,如下图所示:

在终端中输入复制下来的代码:

3.4 获取结果

4.源码地址

这里仅仅以开源代码为案例,可以通过此链接获取源码。在此向作者表示由衷的敬意

Python3调用新浪微博API抓取数据相关推荐

  1. python3调用新浪微博API 报HTTP Error 403: Forbid、400 Bad Request错误

    python3 调用新浪微博API时,出现两种错误 1. Error 403: Forbid 一个原因是在新浪微博开放平台注册的应用平台没有审核,会限制访问次数.可以重新申请一个应用平台,即可访问正常 ...

  2. java模拟新浪微博_Java模拟新浪微博登陆抓取数据

    前言: 兄弟们来了来了,最近有人在问如何模拟新浪微博登陆抓取数据,我听后默默地抽了一口老烟,暗暗的对自己说,老汉是时候该你出场了,所以今天有时间就整理整理,浅谈一二. 首先: 要想登陆新浪微博需要预登 ...

  3. 分享:Python使用cookielib和urllib2模拟登陆新浪微博并抓取数据

    Python使用cookielib和urllib2模拟登陆新浪微博并抓取数据 http://my.oschina.net/leopardsaga/blog/94774

  4. 使用Python调用Flickr API抓取图片数据

    Flickr是雅虎旗下的图片分享网站,上面有全世界网友分享的大量精彩图片,被认为是专业的图片网站.其API也很友好,可以实现多种功能.这里我使用了Python调用其API获得了大量的照片数据.需要注意 ...

  5. pythonurllib微博登录怎么删_Python使用cookielib和urllib2模拟登陆新浪微博并抓取数据...

    我们都知道HTTP是无连接的状态协议,但是客户端和服务器端需要保持一些相互信息,比如cookie,有了cookie,服务器才能知道刚才是这个用户登录了网站,才会给予客户端访问一些页面的权限. 用浏览器 ...

  6. 微博登录记录pythonurllib_Python使用cookielib和urllib2模拟登陆新浪微博并抓取数据...

    我们都知道HTTP是无连接的状态协议,但是客户端和服务器端需要保持一些相互信息,比如cookie,有了cookie,服务器才能知道刚才是这个用户登录了网站,才会给予客户端访问一些页面的权限. 用浏览器 ...

  7. pythonurllib登录微博账号_Python使用cookielib和urllib2模拟登录新浪微博并抓取数据...

    这个方法抓下来的网页,得不到相册图片,新浪要js动态生成图片,解决方法能够是:1. 本地用webkit跑抓下来的js:2.抓移动版微博的静态相册. 但都暂时未实现,欢迎回帖好方法,如下是转文. --- ...

  8. python3爬虫系列23之selenium+腾讯OCR识别验证码登录微博且抓取数据

    python3爬虫系列23之selenium+腾讯OCR识别验证码登录微博且抓取数据 1.前言 上一篇是一个 python3爬虫系列22之selenium模拟登录需要验证码的微博且抓取数据, 我们是首 ...

  9. 测试开发Python培训:抓取新浪微博抓取数据-技术篇

    测试开发Python培训:抓取新浪微博抓取数据-技术篇 poptest是国内唯一一家培养测试开发工程师的培训机构,以学员能胜任自动化测试,性能测试,测试工具开发等工作为目标.在poptest的sele ...

  10. 基于Thinkphp5+phpQuery 网络爬虫抓取数据接口,统一输出接口数据api

    TP5_Splider 一个基于Thinkphp5+phpQuery 网络爬虫抓取数据接口 统一输出接口数据api.适合正在学习Vue,AngularJs框架学习 开发demo,需要接口并保证接口不跨 ...

最新文章

  1. data-参数说明(模态弹出窗的使用)
  2. C socket编程
  3. Genymotion模拟器拖入文件报An error occured while deploying the file的错误
  4. 表示探索、探究的几个词
  5. 抖音后台开发社招面试
  6. 【leetcode】给定一个整数数组和一个整数 k, 你需要在数组里找到不同的 k-diff数对。
  7. Jquery—JQuery对select的操作(01)
  8. 2021ACA世界大赛线上全球总决赛,绽放中国创意设计色彩
  9. VOS3000 8.05安装及源码
  10. cs231n学习记录
  11. 2.8.13 hadoop体系之离线计算-HBase数据库-HBase的优化
  12. “泰迪杯”挑战赛 - 基于协同过滤的推荐算法研究与 GUI 设计
  13. 【JAVA】poi-tl简单实现调查问卷word模板
  14. pscp新机器提示Store key in cache? 重装后提示Update cached key?的解决方案
  15. 树莓派云台舵机怎么用_教程 - 由多个舵机控制的云台 - MAKE 趣无尽
  16. Python爬取链家的数据并绘制热力图
  17. G++’s Family
  18. 《自拍教程44》Python adb一键截取Logcat日志
  19. 设计模式(10)——策略模式
  20. Discuz论坛怎么样防止被人恶意灌水

热门文章

  1. Windows 系统彻底卸载 SQL Server 通用方法
  2. 我的世界HMCL如何安装Java_Ubuntu 18.04 LTS 使用 Minecraft 我的世界第三方启动器 HMCL...
  3. 【论文阅读笔记】文本相似度分析方面
  4. matlab 图片保存pdf,matlab中的图片保存技巧.pdf
  5. Python对象与json数据的转换
  6. cmder中文乱码问题
  7. 离散数学第二版傅彦课后题答案_青年大最新答案第十季第四期答案 完整版题目和答案分享[多图]...
  8. 使用yuicompressor-maven-plugin压缩js及css文件
  9. php滑动门效果,基于JavaScript实现滑动门效果的代码实例介绍(图文)
  10. android测试tf卡读写速度,高速TF卡 , 闪迪还是三星?读写速度对比以及上当经历...