Python3调用新浪微博API抓取数据
本文介绍基于Python3+通过调用新浪微博API方式采集用户信息的案例。
1.前期准备
- 编程语言:Python3.0+
- 下载库:sinaweibopy3
- 编辑软件:Spyder
2.获取微博授权
进入http://open.weibo.com/apps/new?sort=web获取App Key以及App Secret。具体方法如下:
2.1 创建应用
如图点击,微链接—>网站接入—>立即接入
设置应用名称和应用分类,其中应用分类选择网页应用。
2.2 获取App Key等
创建完成后,即进入到应用中,随后在基本信息中获取App Key以及App Secret两个关键代码。
在高级信息中,点击OAuth2.0,选择编辑项
均填入:https://api.weibo.com/oauth2/default.html
3.编写程序
启动Spyder,随后将测试代码粘贴进来。
3.1 导入库
import webbrowser
import sinaweibopy3
这里需要注意的是sinaweibopy3库已经下载到和你当前程序在同一目录下,如下图所示:
而 webbrowser库为Python3.0+自带库,无需安装。
3.2 参数设置
APP_KEY = 'XXXXXXXXXXXXXXX'
APP_SECRET = 'XXXXXXXXXXXXXXXXXXXXXXXX'
REDIRECT_URL = 'XXXXXXXXXXXXXXXXXXXXXXXXXXX'
这里填入刚才申请下来的专属代码【2.2小节】,用于识别应用。
3.3 通过验证生成URL
client = sinaweibopy3.APIClient(app_key=APP_KEY, app_secret=APP_SECRET, redirect_uri=REDIRECT_URL)
url = client.get_authorize_url()
webbrowser.open_new(url)
result = client.request_access_token(
input("please input code : "))
print(result)
client.set_access_token(result.access_token, result.expires_in)
运行到此时,会调用浏览器弹出授权页面,点击授权后会转到默认页面,如下图所示:
在终端中输入复制下来的代码:
3.4 获取结果
4.源码地址
这里仅仅以开源代码为案例,可以通过此链接获取源码。在此向作者表示由衷的敬意!
Python3调用新浪微博API抓取数据相关推荐
- python3调用新浪微博API 报HTTP Error 403: Forbid、400 Bad Request错误
python3 调用新浪微博API时,出现两种错误 1. Error 403: Forbid 一个原因是在新浪微博开放平台注册的应用平台没有审核,会限制访问次数.可以重新申请一个应用平台,即可访问正常 ...
- java模拟新浪微博_Java模拟新浪微博登陆抓取数据
前言: 兄弟们来了来了,最近有人在问如何模拟新浪微博登陆抓取数据,我听后默默地抽了一口老烟,暗暗的对自己说,老汉是时候该你出场了,所以今天有时间就整理整理,浅谈一二. 首先: 要想登陆新浪微博需要预登 ...
- 分享:Python使用cookielib和urllib2模拟登陆新浪微博并抓取数据
Python使用cookielib和urllib2模拟登陆新浪微博并抓取数据 http://my.oschina.net/leopardsaga/blog/94774
- 使用Python调用Flickr API抓取图片数据
Flickr是雅虎旗下的图片分享网站,上面有全世界网友分享的大量精彩图片,被认为是专业的图片网站.其API也很友好,可以实现多种功能.这里我使用了Python调用其API获得了大量的照片数据.需要注意 ...
- pythonurllib微博登录怎么删_Python使用cookielib和urllib2模拟登陆新浪微博并抓取数据...
我们都知道HTTP是无连接的状态协议,但是客户端和服务器端需要保持一些相互信息,比如cookie,有了cookie,服务器才能知道刚才是这个用户登录了网站,才会给予客户端访问一些页面的权限. 用浏览器 ...
- 微博登录记录pythonurllib_Python使用cookielib和urllib2模拟登陆新浪微博并抓取数据...
我们都知道HTTP是无连接的状态协议,但是客户端和服务器端需要保持一些相互信息,比如cookie,有了cookie,服务器才能知道刚才是这个用户登录了网站,才会给予客户端访问一些页面的权限. 用浏览器 ...
- pythonurllib登录微博账号_Python使用cookielib和urllib2模拟登录新浪微博并抓取数据...
这个方法抓下来的网页,得不到相册图片,新浪要js动态生成图片,解决方法能够是:1. 本地用webkit跑抓下来的js:2.抓移动版微博的静态相册. 但都暂时未实现,欢迎回帖好方法,如下是转文. --- ...
- python3爬虫系列23之selenium+腾讯OCR识别验证码登录微博且抓取数据
python3爬虫系列23之selenium+腾讯OCR识别验证码登录微博且抓取数据 1.前言 上一篇是一个 python3爬虫系列22之selenium模拟登录需要验证码的微博且抓取数据, 我们是首 ...
- 测试开发Python培训:抓取新浪微博抓取数据-技术篇
测试开发Python培训:抓取新浪微博抓取数据-技术篇 poptest是国内唯一一家培养测试开发工程师的培训机构,以学员能胜任自动化测试,性能测试,测试工具开发等工作为目标.在poptest的sele ...
- 基于Thinkphp5+phpQuery 网络爬虫抓取数据接口,统一输出接口数据api
TP5_Splider 一个基于Thinkphp5+phpQuery 网络爬虫抓取数据接口 统一输出接口数据api.适合正在学习Vue,AngularJs框架学习 开发demo,需要接口并保证接口不跨 ...
最新文章
- data-参数说明(模态弹出窗的使用)
- C socket编程
- Genymotion模拟器拖入文件报An error occured while deploying the file的错误
- 表示探索、探究的几个词
- 抖音后台开发社招面试
- 【leetcode】给定一个整数数组和一个整数 k, 你需要在数组里找到不同的 k-diff数对。
- Jquery—JQuery对select的操作(01)
- 2021ACA世界大赛线上全球总决赛,绽放中国创意设计色彩
- VOS3000 8.05安装及源码
- cs231n学习记录
- 2.8.13 hadoop体系之离线计算-HBase数据库-HBase的优化
- “泰迪杯”挑战赛 - 基于协同过滤的推荐算法研究与 GUI 设计
- 【JAVA】poi-tl简单实现调查问卷word模板
- pscp新机器提示Store key in cache? 重装后提示Update cached key?的解决方案
- 树莓派云台舵机怎么用_教程 - 由多个舵机控制的云台 - MAKE 趣无尽
- Python爬取链家的数据并绘制热力图
- G++’s Family
- 《自拍教程44》Python adb一键截取Logcat日志
- 设计模式(10)——策略模式
- Discuz论坛怎么样防止被人恶意灌水
热门文章
- Windows 系统彻底卸载 SQL Server 通用方法
- 我的世界HMCL如何安装Java_Ubuntu 18.04 LTS 使用 Minecraft 我的世界第三方启动器 HMCL...
- 【论文阅读笔记】文本相似度分析方面
- matlab 图片保存pdf,matlab中的图片保存技巧.pdf
- Python对象与json数据的转换
- cmder中文乱码问题
- 离散数学第二版傅彦课后题答案_青年大最新答案第十季第四期答案 完整版题目和答案分享[多图]...
- 使用yuicompressor-maven-plugin压缩js及css文件
- php滑动门效果,基于JavaScript实现滑动门效果的代码实例介绍(图文)
- android测试tf卡读写速度,高速TF卡 , 闪迪还是三星?读写速度对比以及上当经历...