推文获取

申请Twitter API

  1. 注册Twitter账号
  2. https://dev.twitter.com/apps, 点击create apps。
  3. 点击确定完成
  4. 在Application Management的Keys and Access Tokens,点击Generate Access Token.

利用tweepy获取特朗普最近推文

# -*- coding: utf-8 -*-
"""
Created on Fri Jan  6 18:31:59 2017@author: caofk
"""
import re
import tweepy
import time
import tweepy
#https://github.com/tweepy/tweepy
import random
import pandas as pd#Twitter API credentials
consumer_key = " "
consumer_secret = " "
access_key = " "
access_secret = " "screen_name = "realDonaldTrump"#authorize twitter, initialize tweepy
auth = tweepy.OAuthHandler(consumer_key, consumer_secret)
auth.set_access_token(access_key, access_secret)
api = tweepy.API(auth)#initialize a list to hold all the tweepy Tweets
alltweets = []  #make initial request for most recent tweets (200 is the maximum allowed count)
new_tweets = api.user_timeline(screen_name = screen_name,count=50)#save most recent tweets
alltweets.extend(new_tweets)#save the id of the oldest tweet less one
oldest = alltweets[-1].id - 1#keep grabbing tweets until there are no tweets left to grab
while len(new_tweets) > 0:print("getting tweets before %s" % (oldest))#all subsiquent requests use the max_id param to prevent duplicatesis_finished = 0while is_finished == 0:try:new_tweets = api.user_timeline(screen_name = screen_name,count=50,max_id=oldest)is_finished = 1except Exception as e:print(e)time.sleep(random.choice(range(300, 600)))is_finished = 0#save most recent tweetsalltweets.extend(new_tweets)#update the id of the oldest tweet less oneoldest = alltweets[-1].id - 1print("...%s tweets downloaded so far" % (len(alltweets)))outtweets = pd.DataFrame()
outtweets["推文ID"] = [tweet.id_str for tweet in alltweets]
outtweets["推文创建时间"] = [tweet.created_at for tweet in alltweets]
outtweets["推文内容"] = [re.sub(r'\s+'," ", tweet.text) for tweet in alltweets]
outtweets.to_excel("E:\\"+ screen_name + 's_tweets.xls')

Twitter数据获取相关推荐

  1. 视频教程-黑客基础——爬虫(从理论剖析到实战演练)-大数据

    黑客基础--爬虫(从理论剖析到实战演练) 美国Texas A&M 在读博士,空间智能计算研究, 曾先后在全球大安全公司从事爬虫工程师.数 据分析.文本挖掘.机器学习等工作.对数据科学 和人工智 ...

  2. 【网络安全】能在Twitter和Instagram上实现信息收集和数据获取的工具

    关于Terra Terra是一款功能强大的公开资源情报工具(OSINT),该工具主要针对的是Twitter和Instagram数据,广大研究人员可以利用Terra在这两个社交媒体平台上实现信息收集和数 ...

  3. python大数据分析实例-如何用Python分析大数据(以Twitter数据挖掘为例)

    原标题:如何用Python分析大数据(以Twitter数据挖掘为例) 来源:艾翻译(http://www.itran.cc/) 原文标题:Twitter Data Mining: A Guide to ...

  4. Twitter爬虫Python库Tweepy 附中英文官方文档

    文章目录 前言 一.Tweepy是什么 二.Tweepy可以干什么 三.一个简单的demo 四.一个更简单的demo 五.文档下载 前言 Twitter Tweepy相关这块内容在CSDN甚至搜索引擎 ...

  5. twitter授权登录 php,PHP版实现Twitter第三方登录的成功案例

    QQ.微信.Fackbook等第三方登录使用OAuth2.0,随便找一些文档跟着做很快实现,没什么难度.等轮到Twitter时候,如果你也这样想,后面它就会证明你是错的! Twitter在当前时间(2 ...

  6. 关于twitter爬虫的总结

    最近有需要收集包含特定关键词的tweets数据.要求查询的时间跨度比较大,使用Twitter给的API有诸多问题,尤其是似乎还突破不了七天的限制,再加上懒得研究,所以还是决定采用爬取网页响应的方式. ...

  7. 有哪些「神奇」的数据获取方式?

    大数据时代,用数据做出理性分析显然更为有力.做数据分析前,能够找到合适的的数据源是一件非常重要的事情,一般获取数据的方式有爬虫.免费数据库.付费API等等.本文给大家推荐一些能够用得上的数据获取方式, ...

  8. Python 使用 twitter API 获取twitter用户信息

    Python 使用 twitter API 获取twitter用户信息 1. 概述 twitter作为国外极其大众化的社交平台,具有大量的海外用户,平台流动数据量极大,是国外人群生活数据的重要来源之一 ...

  9. 过零检测变压器降压_用变压器检测状态支持的Twitter巨魔

    过零检测变压器降压 With the 2020 US election around the corner, concerns about electoral interference by stat ...

  10. 安卓三方登录趟坑,QQ,微信,微博,Twitter,Facebook,Instagram

    前言 最近给app加入三方登录,由于比较多,所以就用的友盟统一登录,会比一个一个配置方便点 正文 先说QQ,微信,微博: 国内QQ,微信,微博三方登录其实还行,并没有太多坑,文档也挺完善的. 但是需要 ...

最新文章

  1. 概率统计 —— 常犯错误
  2. java 反序列化工具 marshalsec改造 加入dubbo-hessian2 exploit
  3. 填涂颜色(洛谷P1162题题解,Java语言描述)
  4. zentaoPHP学习
  5. 电力物联网智慧路灯充电桩传感器技术应用方案
  6. Atitit 信息系统安全法 目录 1. 常见的安全保护目标 1 2. WEB安全风险行为 2 2.1. Injection 2 2.2. Broker Authentication损坏的身份验证
  7. 把ICDAR2019-LSVT原始数据集转为REC任务识别数据
  8. 国际首个!OpenV2X 开源社区成立,填补 5G 路侧开放基础架构(RSOI)空白
  9. VUE调用高德地图之热力图
  10. NOJ [1184] Elaine's Queue
  11. Android 修改AlertDialog原生setPositiveButton的字体颜色背景颜色大小边距位置
  12. fastLane 初试
  13. 百度API---详解
  14. mysql完美国际数据库_完美国际 数据库
  15. Android Apk签名修改V1,V2,V3,V4
  16. 第14章 14.1 来自Bitly的USA.gov数据(1)
  17. 苹果CMS怎么更换模板详细教程
  18. 几款常见蓝牙芯片整理
  19. verilog编写数字频率计
  20. 如何通过MES实现机床联网?

热门文章

  1. c++:std::dec, std::hex, std::oct
  2. 环境搭建—3.0 Linaro gcc
  3. 手机应用程序的可用性研究数据的获取、过滤、分析
  4. dns辅服务器修复后还不能上网,dns修复后还是不能上网如何解决
  5. 游戏制作人谈10大开发经验
  6. 阐述篇-聊聊我眼中の《面试宝典》
  7. python新版个人所得税代码_个人所得税计算代码
  8. 零点定理和罗尔定理的完善?
  9. 谷歌邮箱(@gmail.com):两步验证+应用专用密码登录
  10. 计算机build是什么意思英语,build是什么意思_build的翻译_音标_读音_用法_例句_爱词霸在线词典...