眼看平安夜,圣诞节,元旦就要来了,刚学了点python就想着用它来爬取一点祝福语短信来练练手。我选择爬取的网站是个性学习网里面的祝福语短信(http://www.hengexing.com/z/80844.html)。

首先看一下爬取的效果,我是存入excel里面的。

然后贴出爬取代码,记录一下这一次爬取的过程:

# coding=utf-8
from bs4 import BeautifulSoup
import requestsimport xlwt#爬取一些短信祝福语
excelTabel= xlwt.Workbook()#创建excel对象
sheet1=excelTabel.add_sheet('平安夜短信祝福语')
nrows = 0
url=""
for num in range(1,6):if num==1:url = "http://www.hengexing.com/z/80844.html"else:url="http://www.hengexing.com/z/80844_%d.html" %numr = requests.get(url)#这里和网页的编码设置相关r.encoding = 'gb2312'#解决乱码问题soup = BeautifulSoup(r.text, 'html.parser')listAA = soup.find_all("p")for text in listAA:print(text.getText())sheet1.write(nrows,0,text.getText())nrows+=1
excelTabel.save("平安夜祝福语.xls")

python爬取圣诞祝福语相关推荐

  1. python爬取春节祝福语,并生成心形词云

    前言 最近刚好在看爬虫,就爬取一下春节祝福语,生成个词云玩一玩,大家有兴趣可以试试,会奉上源代码,很简单.效果图如下: 环境 环境:windows, 语言:python,python版本是3.7 所依 ...

  2. python写圣诞祝福语_python爬取圣诞祝福语,省事好多,再也不用担心笔下无墨

    又是一年一度的圣诞节了,在此祝大家圣诞节快乐! 首先要配置bs4,BeautifulSoup库和requests,代码如下,不同网站可能编码方式不同要调整,不然会导致中文出现乱码,这里以http:// ...

  3. 看看你爱的他今天是什么‘颜色‘ -- Python爬取微博评论制作专属偶像词云

    简介:快来拿出你珍藏的pick star,用大家对他的爱重塑一个他吧.通过爬取微博评论,制作你的偶像图片词云,天天都是不重样的哦! 很多人学习python,不知道从何学起. 很多人学习python,掌 ...

  4. python爬取笔趣阁小说(附源码)

    python爬取笔趣阁小说 文章目录 python爬取笔趣阁小说 前言 一.获取小说目录结构 获取目录连接 请求代码 解析目录 XPath tqdm 解析 二.获取小说章节结构 请求代码 解析章节 代 ...

  5. python爬取qq音乐标签_Python爬取qq音乐的过程实例

    一.前言 qq music上的音乐还是不少的,有些时候想要下载好听的音乐,但有每次在网页下载都是烦人的登录什么的.于是,来了个qqmusic的爬虫.至少我觉得for循环爬虫,最核心的应该就是找到待爬元 ...

  6. Python爬取王者荣耀全英雄全皮肤图片

    Python爬取王者荣耀全英雄全皮肤图片 前言 思路 分析 编码 案例源码 附图 总结 前言 以前写过类似的博客,利用Java爬取王者荣耀全英雄全皮肤图片,当时是利用 jsoup包来对目标网页进行解析 ...

  7. Python爬取特朗普就职演讲稿,使用ngram模型进行数据清洗

    利用Python爬取特朗普英文就职演讲稿,并使用ngram模型进行数据清洗处理   互联网络上数据十分丰富,我们可以利用网络爬虫技术轻松获取到这些数据,但是获取的数据往往不像我们学习爬虫时那样样式规范 ...

  8. Python 爬取电影天堂top最新电影

    Python爬虫有他无可比拟的优势:语法简单,经常几十行代码就能轻松解决问题,相比于JAVA,C,PHP;第三方库丰富,Python强大而又丰富的第三方库使他几乎可以无所不能.今天我们就来用用Pyth ...

  9. 用Python爬取了全国近5000家旅游景点,分析国庆去哪玩

    双节同庆,小长假如约而至 我想今年大家在家都憋坏了 这么长的假期,当然是出去 玩玩玩! 每当长假的时候,有没有想起被人山人海支配的恐惧! 该去哪些地方呢? 我用 Python 爬取了全国近 5000 ...

最新文章

  1. 690.员工的重要性
  2. JavaScript 各种遍历方式详解
  3. 主宰全球的10大算法
  4. 第六次作业——团队作业
  5. POJ - 1734 Sightseeing trip(最小环+输出路径)
  6. [Mechine Learning Algorithm] 集成学习方法——Bagging和 Boosting
  7. 中国内容广告行业市场供需与战略研究报告
  8. Android从无知到有知——NO.6
  9. Flutter Provider框架实现简单的购物车
  10. jsp mysql超市管理_基于WEB的小型超市管理系统的设计与实现(JSP,MySQL)
  11. 怎样停止魅族系统的推送服务器,实测可行!如何关闭魅族flyme系统的自带应用推送-魅蓝屏蔽设置...
  12. wpsmac历史版本_wps mac版-WPS Office 2019 for Mac1.9.0(2959)官方版
  13. matlab中怎么使用数组,matlab中数组的基本使用
  14. 微信聊天软件测试用例设计,微信页面测试用例_20140819
  15. 查看win11激活状态
  16. 为什么印度人可以“称霸”硅谷?
  17. ERP与MES的区别与联系
  18. 火狐浏览器书签工具栏图标_在Firefox书签工具栏中浓缩书签
  19. 敏感词过滤案例(Filter过滤器)
  20. java 线程池 优先队列_(十六)java多线程之优先队列PriorityBlockingQueue

热门文章

  1. 【附源码】计算机毕业设计java中小学图书馆管理设计与实现
  2. xmlstarlet_开始使用XMLStarlet
  3. w25n01g 代码_W25N01
  4. 对当前国内CRM市场发展的一点拙见
  5. ubuntu16.04 bashrc文件在哪
  6. vnc连接云主机,vnc连接云主机怎么连接,有哪些好用的软件
  7. 用c++做一个简单的打飞机小游戏(详细说明与注释)
  8. 即刻了解血压血糖动态,健康数据轻松掌握,dido E55PROMAX体验
  9. Linux操作系统——批量创建用户
  10. 利用python编写一段手柄控制程序