这里是用腾讯读做为例子,将它的内容转TXT文件后下载的这样一个python代码。

import re, os, urllib2

url = 'http://book.qq.com/s/book/0/22/22707/'

page_re = re.escape(url) + r'\d+\.shtml'

data = urllib2.urlopen(url).read()

pages = re.findall(page_re, data)

count = 1

txt = []

for page in pages:

html = urllib2.urlopen(page).read()

print "downloading [%d/%d], %s" % (count, len(pages), page)

m = re.findall(re.escape('

'), html, re.DOTALL)

if m:

m = m[0]

txt.append(m)

count += 1

f=open('downqq.html', 'wb')#www.iplaypy.com

f.write("""/p>

"http://www.w3.org/TR/html4/loose.dtd">

""")

f.write('\r\n\r\n\r\n'.join(txt))

f.write('')

f.close()

print("DONE!")

os.system("downqq.html")

玩蛇网文章,转载请注明出处和文章网址:https://www.iplaypy.com/code/text-file/tf2635.html

相关文章 Recommend

python下载txt_腾讯读书转TXT文件下载python代码相关推荐

  1. python下载哪个版本好-究竟哪个版本的Python是最快的?

    作者|Anthony Shaw 编辑|安翔 Python 3 比 Python 2 慢吗?哪个版本的 Python 3 速度最快?还有哪些措施可以提高速度?究竟哪个版本的 Python 是最快的?当然 ...

  2. 学习python下载哪个版本_听学编程之Python 一、Python版本和安装

    本文应听友要求,根据喜马拉雅上的音频节目『听学编程之Python』整理所得. python是好是坏,我就不多啰嗦了,既然你收听了这个教程,那就说明你要学这个语言了.基本不会亏的.这个语言很有用,完全可 ...

  3. python爬取腾讯视频弹幕_用Python爬取腾讯视频弹幕

    原标题:用Python爬取腾讯视频弹幕 via:菜J学Python 1.网页分析 本文以爬取<脱口秀大会 第3季>最后一期视频弹幕为例,首先通过以下步骤找到存放弹幕的真实url. 通过删减 ...

  4. python下载笔趣阁小说生成txt文档

    最近在看一本小说,每次点击下一章,就要等哈,而且有的还有广告,有点烦,就下载个txt了,没有广告,没有等待,哈哈 代码如下 # coding=utf-8 import requests from bs ...

  5. 腾讯云python环境_腾讯云centos6.5 搭建python机器学习环境

    腾讯云centos6.5 安装zlib+python2.7+机器学习常用库 本人原文在https://github.com/zqmath1994/Note/blob/master/Linux总结/腾讯 ...

  6. Python 用pip批量安装包 requirements.txt(python查看安装的第三方扩展包)| 利用requirements.txt离线安装依赖包

    文章目录 一.python用pip批量安装包 pip freeze 为什么比 pip list 的包少几个呢? 二.[推荐]使用pipreqs 写入requirements.txt 三.利用requi ...

  7. python打开一个文件夹下所有txt文件-python读取一个目录下所有txt里面的内容方法...

    实例如下所示: import os allFileNum = 0 def printPath(level, path): global allFileNum ''''' 打印一个目录下的所有文件夹和文 ...

  8. python下载网页歌词_使用Python下载歌词并嵌入歌曲文件中的实现代码

    使用python扫描本地音乐并下载歌词这次这个真的是干货哦,昨晚弄了半晚上,,,,从8点吃完饭就开始写,一直到了快12点才弄好,,,新手,伤不起呀.... 先简单的说下吧,百度提供了一个音乐搜索的ap ...

  9. python下载网页中的pdf文件_【Python】Python的urllib模块、urllib2模块批量进行网页下载文件...

    由于需要从某个网页上下载一些PDF文件,但是需要下载的PDF文件有几百个,所以不可能用人工点击来下载.正好Python有相关的模块,所以写了个程序来进行PDF文件的下载,顺便熟悉了Python的url ...

最新文章

  1. 开发日记-20190526 关键词 读书笔记《鸟哥的Linux私房菜-基础学习篇》
  2. 强化学习笔记 experience replay 经验回放
  3. 4、Python运算符、比较运算符、赋值运算符、位运算符、逻辑运算符、成员运算符、身份运算符、运算符优先级(学些笔记)
  4. 【C++】函数缺省参数的作用
  5. win10专业版和企业版的区别_深度完美Win10_1809_LTSC.1158_64位企业版V2020.0415
  6. react.lazy 路由懒加载_Vue面试题: 如何实现路由懒加载?
  7. 模板应用到多个主机 zabbix_Zabbix监控TCP连接数
  8. 工作那些事儿(8)- 废旧立新
  9. Java进阶之路——从初级程序员到架构师,从小工到专家(转)
  10. jquery 元素第二个_jQuery知识总结
  11. ppt转换成pdf软件免费版
  12. 计算机组成与原理第二章,计算机组成原理《第二章》
  13. H3CIE(WLAN)学习笔记(1)——电磁场基础
  14. [论文笔记|VIO]On the Comparison of Gauge Freedom Handling in Optimization-based V-I State Estimation
  15. Flutter 错误解决Building with plugins requires symlink support.
  16. 育碧开发了一个 AI 工具,能快速找出代码中的 Bug
  17. 缺少包含@author的注释信息解决方法
  18. 脑电EEG的几种蒙太奇
  19. iOS 7 最佳实践;一个天气应用: Part 1/2
  20. 杰理之在线 EQ 调试【篇】

热门文章

  1. DB2 SQLSTATE 42803
  2. SpringCloud使用Sofa-lookout监控(基于Eureka) 1
  3. nodejs原型链污染
  4. 「2024」预备研究生mem-出题套路四:同时给出逻辑真事实真
  5. Chkconfig 作用与原理小结
  6. 输出26个小写英文字母c语言,菜鸟求助,写一个随机输出26个英文字母的程序
  7. U盘使用记录删除方法
  8. vb.net 教程 3-4 窗体编程 公共控件4 MaskedTextBox
  9. 突发!PHP服务器被攻击,恶意代码合入git仓库
  10. 国产AI作画神器火了,更懂中文,竟然还能做周边!