Twitter数据获取
推文获取
申请Twitter API
- 注册Twitter账号
- https://dev.twitter.com/apps, 点击create apps。
- 点击确定完成
- 在Application Management的Keys and Access Tokens,点击Generate Access Token.
利用tweepy获取特朗普最近推文
# -*- coding: utf-8 -*-
"""
Created on Fri Jan 6 18:31:59 2017@author: caofk
"""
import re
import tweepy
import time
import tweepy
#https://github.com/tweepy/tweepy
import random
import pandas as pd#Twitter API credentials
consumer_key = " "
consumer_secret = " "
access_key = " "
access_secret = " "screen_name = "realDonaldTrump"#authorize twitter, initialize tweepy
auth = tweepy.OAuthHandler(consumer_key, consumer_secret)
auth.set_access_token(access_key, access_secret)
api = tweepy.API(auth)#initialize a list to hold all the tweepy Tweets
alltweets = [] #make initial request for most recent tweets (200 is the maximum allowed count)
new_tweets = api.user_timeline(screen_name = screen_name,count=50)#save most recent tweets
alltweets.extend(new_tweets)#save the id of the oldest tweet less one
oldest = alltweets[-1].id - 1#keep grabbing tweets until there are no tweets left to grab
while len(new_tweets) > 0:print("getting tweets before %s" % (oldest))#all subsiquent requests use the max_id param to prevent duplicatesis_finished = 0while is_finished == 0:try:new_tweets = api.user_timeline(screen_name = screen_name,count=50,max_id=oldest)is_finished = 1except Exception as e:print(e)time.sleep(random.choice(range(300, 600)))is_finished = 0#save most recent tweetsalltweets.extend(new_tweets)#update the id of the oldest tweet less oneoldest = alltweets[-1].id - 1print("...%s tweets downloaded so far" % (len(alltweets)))outtweets = pd.DataFrame()
outtweets["推文ID"] = [tweet.id_str for tweet in alltweets]
outtweets["推文创建时间"] = [tweet.created_at for tweet in alltweets]
outtweets["推文内容"] = [re.sub(r'\s+'," ", tweet.text) for tweet in alltweets]
outtweets.to_excel("E:\\"+ screen_name + 's_tweets.xls')
Twitter数据获取相关推荐
- 视频教程-黑客基础——爬虫(从理论剖析到实战演练)-大数据
黑客基础--爬虫(从理论剖析到实战演练) 美国Texas A&M 在读博士,空间智能计算研究, 曾先后在全球大安全公司从事爬虫工程师.数 据分析.文本挖掘.机器学习等工作.对数据科学 和人工智 ...
- 【网络安全】能在Twitter和Instagram上实现信息收集和数据获取的工具
关于Terra Terra是一款功能强大的公开资源情报工具(OSINT),该工具主要针对的是Twitter和Instagram数据,广大研究人员可以利用Terra在这两个社交媒体平台上实现信息收集和数 ...
- python大数据分析实例-如何用Python分析大数据(以Twitter数据挖掘为例)
原标题:如何用Python分析大数据(以Twitter数据挖掘为例) 来源:艾翻译(http://www.itran.cc/) 原文标题:Twitter Data Mining: A Guide to ...
- Twitter爬虫Python库Tweepy 附中英文官方文档
文章目录 前言 一.Tweepy是什么 二.Tweepy可以干什么 三.一个简单的demo 四.一个更简单的demo 五.文档下载 前言 Twitter Tweepy相关这块内容在CSDN甚至搜索引擎 ...
- twitter授权登录 php,PHP版实现Twitter第三方登录的成功案例
QQ.微信.Fackbook等第三方登录使用OAuth2.0,随便找一些文档跟着做很快实现,没什么难度.等轮到Twitter时候,如果你也这样想,后面它就会证明你是错的! Twitter在当前时间(2 ...
- 关于twitter爬虫的总结
最近有需要收集包含特定关键词的tweets数据.要求查询的时间跨度比较大,使用Twitter给的API有诸多问题,尤其是似乎还突破不了七天的限制,再加上懒得研究,所以还是决定采用爬取网页响应的方式. ...
- 有哪些「神奇」的数据获取方式?
大数据时代,用数据做出理性分析显然更为有力.做数据分析前,能够找到合适的的数据源是一件非常重要的事情,一般获取数据的方式有爬虫.免费数据库.付费API等等.本文给大家推荐一些能够用得上的数据获取方式, ...
- Python 使用 twitter API 获取twitter用户信息
Python 使用 twitter API 获取twitter用户信息 1. 概述 twitter作为国外极其大众化的社交平台,具有大量的海外用户,平台流动数据量极大,是国外人群生活数据的重要来源之一 ...
- 过零检测变压器降压_用变压器检测状态支持的Twitter巨魔
过零检测变压器降压 With the 2020 US election around the corner, concerns about electoral interference by stat ...
- 安卓三方登录趟坑,QQ,微信,微博,Twitter,Facebook,Instagram
前言 最近给app加入三方登录,由于比较多,所以就用的友盟统一登录,会比一个一个配置方便点 正文 先说QQ,微信,微博: 国内QQ,微信,微博三方登录其实还行,并没有太多坑,文档也挺完善的. 但是需要 ...
最新文章
- 概率统计 —— 常犯错误
- java 反序列化工具 marshalsec改造 加入dubbo-hessian2 exploit
- 填涂颜色(洛谷P1162题题解,Java语言描述)
- zentaoPHP学习
- 电力物联网智慧路灯充电桩传感器技术应用方案
- Atitit 信息系统安全法 目录 1. 常见的安全保护目标	1 2. WEB安全风险行为	2 2.1. Injection	2 2.2. Broker Authentication损坏的身份验证
- 把ICDAR2019-LSVT原始数据集转为REC任务识别数据
- 国际首个!OpenV2X 开源社区成立,填补 5G 路侧开放基础架构(RSOI)空白
- VUE调用高德地图之热力图
- NOJ [1184] Elaine's Queue
- Android 修改AlertDialog原生setPositiveButton的字体颜色背景颜色大小边距位置
- fastLane 初试
- 百度API---详解
- mysql完美国际数据库_完美国际 数据库
- Android Apk签名修改V1,V2,V3,V4
- 第14章 14.1 来自Bitly的USA.gov数据(1)
- 苹果CMS怎么更换模板详细教程
- 几款常见蓝牙芯片整理
- verilog编写数字频率计
- 如何通过MES实现机床联网?
热门文章
- c++:std::dec, std::hex, std::oct
- 环境搭建—3.0 Linaro gcc
- 手机应用程序的可用性研究数据的获取、过滤、分析
- dns辅服务器修复后还不能上网,dns修复后还是不能上网如何解决
- 游戏制作人谈10大开发经验
- 阐述篇-聊聊我眼中の《面试宝典》
- python新版个人所得税代码_个人所得税计算代码
- 零点定理和罗尔定理的完善?
- 谷歌邮箱(@gmail.com):两步验证+应用专用密码登录
- 计算机build是什么意思英语,build是什么意思_build的翻译_音标_读音_用法_例句_爱词霸在线词典...