Python实现半自动发微博【用COOKIES代替模拟登录;用WAP版微博代替网页版微博;每次还要改post数据的URL。。。半半自动的感觉】

微博的内容是从糗事百科抓取的最热段子以及某网站的每日晚安。#!/usr/bin/python

#coding=utf-8

import urllib

import urllib2

import time

import requests

import re

from bs4 import BeautifulSoup

import sys

import os

import string

import info.qiubai

import info.wanan

'''

编码方式的设置,在中文使用时用到中文时的处理方式

'''

default_encoding = "utf-8"

if sys.getdefaultencoding() != default_encoding:

reload(sys)

sys.setdefaultencoding("utf-8")

headers = {

'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10_5) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/47.0.2526.106 Safari/537.36',

'Cookie':"你自己的COOKIES。。。通过浏览器自己找吧",

'Accept':"text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8",

'Referer':"http://weibo.cn/"

}

def getHtml(url):

response=urllib2.urlopen(url)

html=response.read()

return html

qiubaiurl='http://www.qiushibaike.com/text/'

request=urllib2.Request(qiubaiurl,headers=headers)

html=getHtml(request)

#可以

qiubaicontent=info.qiubai.getQiubai(html)

print qiubaicontent

wananurl='http://www.gxdxw.cn/wananxinyu/'

request=urllib2.Request(wananurl,headers=headers)

#可以

wanancontent=info.wanan.getWanan(getHtml(request))

print wanancontent

post_url='http://weibo.cn/mblog/sendmblog?st=ef5d80'

currentime=time.localtime(time.time()).tm_hour

if (currentime>21)and(currentime<24):

content=wanancontent

else:

content=qiubaicontent

post_data={'rl':'1','content':content}

r=requests.post(post_url,post_data,headers=headers)

print r

if(r.status_code==200):#....不对

print "发送微博成功"

else:

print "微博发送失败,请检查cookies是否过期"

PS:1、利用Python自带的时间函数控制哪个时间段发那些内容。。。

2、但是好多时候发送数据都不成功。。。我也不知道怎么知道我的微博发送成功了,只能一次一次试。。。有点尴尬。。知道的大神指点一下!!!

3、还有那个微博POST数据的参数,一天换一次的感觉

4、最后我把抓取糗百和晚安的程序分开了。在新建了一个info文件夹-------搞成了模块。。。貌似是这样

最后再附上糗百和晚安的程序吧。。。。。。。我也不知道格式对不对。。反正最后运行了糗百

#coding=utf-8

import sys

from bs4 import BeautifulSoup

'''

编码方式的设置,在中文使用时用到中文时的处理方式

'''

default_encoding = "utf-8"

if sys.getdefaultencoding() != default_encoding:

reload(sys)

sys.setdefaultencoding("utf-8")

def getQiubai(html):

soup=BeautifulSoup(html,'html.parser')

div=soup.find_all('div',attrs={'class':'content'})

content="#每日糗事#"+div[0].text.lstrip()

return content晚安

#coding=utf-8

import sys

from bs4 import BeautifulSoup

'''

编码方式的设置,在中文使用时用到中文时的处理方式

'''

default_encoding = "utf-8"

if sys.getdefaultencoding() != default_encoding:

reload(sys)

sys.setdefaultencoding("utf-8")

def getWanan(html):

soup=BeautifulSoup(html,'html.parser')

div=soup.find_all('div',attrs={'class':'listbox'})[0]

a=div.find_all('a')[1]

content=a.text.lstrip()

# print content

return content

python抓取微博数据_Python爬虫实现半自动发微博相关推荐

  1. python抓取数据库数据_Python爬虫抓取东方财富网股票数据并实现MySQL数据库存储...

    Python爬虫可以说是好玩又好用了.现想利用Python爬取网页股票数据保存到本地csv数据文件中,同时想把股票数据保存到MySQL数据库中.需求有了,剩下的就是实现了. 在开始之前,保证已经安装好 ...

  2. python爬取flash数据_python爬虫: 爬取flash播放页面的信息

    我们通过查看知道flash类型的网页采取文件格式是amf类型的 AMF(Action Message Format) 是Flash与服务端通信的一种常见的二进制编码模式,其传输效率高,可以在HTTP层 ...

  3. python抓取表格数据_Python如何实现从PDF文件中爬取表格数据(代码示例)

    本篇文章给大家带来的内容是关于Python如何实现从PDF文件中爬取表格数据(代码示例),有一定的参考价值,有需要的朋友可以参考一下,希望对你有所帮助. 本文将展示一个稍微不一样点的爬虫. 以往我们的 ...

  4. python抓取股票数据_Python股票处理之一_获取国内股票数据

    1. 安装支持库 $ pip install panda $ pip install tushare 2. 说明 Pandas是数据分析工具包 TuShare是国内股票数据抓取工具,除了股票的实时和历 ...

  5. python抓取招聘数据_Python爬取招聘网站数据并做数据可视化处理

    本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. 以下文章来源于青灯编程 ,作者:清风 前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有 ...

  6. python抓取股票数据_Python自动获取当日所有股票数据

    开年以来,大盘直接从2400站上了3200,为了后续进一步分析股票数据,我想把每只股票每天的数据保存下来. import pandas as pd import tushare as ts impor ...

  7. python抓取疫情数据_python 爬取疫情数据

    {"moduleinfo":{"card_count":[{"count_phone":1,"count":1}],&q ...

  8. python 抓取网页数据

    python 抓取网页数据 此文解决如何从不同网页爬取数据的问题及注意事项,重点说明requests库的应用. 在开始之前,要郑重说明一下,不是每一个网页都可以爬取数据哦.有的网页涉及个人隐私或其他敏 ...

  9. python 抓包解析数据_Python抓包并解析json爬虫的完整实例代码

    Python抓包并解析json爬虫 在使用Python爬虫的时候,通过抓包url,打开url可能会遇见以下类似网址,打开后会出现类似这样的界面,无法继续进行爬虫: 例如: 需要爬取网页中第二页的数据时 ...

最新文章

  1. linux视频教程 iptables 跟踪,linux – 了解iptables中的连接跟踪
  2. [外文理解] DDD创始人Eric Vans:要实现DDD原始意图,必须CQRS+Event Sourcing架构。
  3. wxWidgets:wxShowEvent类用法
  4. tair client java_TFS(Taobao File System)Java Client 使用经验
  5. 查询空缺_携程旅行2021校招开启,9大类职位,1000+岗位空缺,本科及以上学历...
  6. [CLR via C#]16. 数组
  7. DataReader对象的基本使用 c#
  8. Mosquitto感知客户端上下线的方法
  9. 2020级C语言大作业 - 王国保卫战
  10. JDK Windows安装
  11. IPTV监测和测试设备
  12. 一听不是双休,连面试都免了
  13. ajax zlib,jQuery递增地读取Ajax流吗?
  14. wxWindows 程序编译选项设置统揽
  15. 泛微OA常用js代码块
  16. python基础教程:Python实现动态给类和对象添加属性和方法操作示例
  17. APK的几种安装方式
  18. Linux常用命令分享
  19. 红色警戒2修改器原理百科(六)
  20. P2184 贪婪大陆 线段树(优化:区间修改变为单点修改)

热门文章

  1. Spring三大核心思想学习笔记
  2. 芝加哥大学计算机博士年薪,专排TOP6芝加哥大学统计学博士录取
  3. C#与基恩士PLC的KV-Nano系列通讯
  4. Python 队列之传土豆(《Python数据结构与算法分析》第二版)
  5. 我又双叒叕倒在了年初立下的flag里
  6. 解析几何复习(二)正交变换和仿射变换
  7. corners边框_Js实现的6种圆角边框样式
  8. 编解码器的世界 - 从字幕组说起
  9. ubifs文件系统制作
  10. 汇编语言(1~7音阶)