更多爬虫内容请关注博主专栏python3网络爬虫

笔趣看小说网:https://www.biqukan.com/

就拿最近热播的猫腻小说《将夜》来实验吧

代码

import requests,sys,os
from bs4 import BeautifulSoup'''@ author: Face_to_sun@ modigy: 2018-12-1'''def getListHTML(url):headers = {'Referer': 'https://www.biqukan.com/s.php?ie=gbk&s=2758772450457967865&q=%BD%AB%D2%B9','User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.62 Safari/537.36'}try:response = requests.get(url, headers=headers)response.raise_for_status()response.encoding = response.apparent_encodingreturn response.textexcept:return "产生异常"def downLoadPage(url, filename):headers = {'Referer': 'https://www.biqukan.com/2_2758/','User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.62 Safari/537.36'}response = requests.get(url, headers=headers, timeout=30)soup = BeautifulSoup(response.text,'lxml')content = soup.find_all('div', class_='showtxt')try:  print(content[0].text.replace('\xa0'*8,'\n\n'))    with open(filename+'.txt', 'w', encoding='utf8') as f:f.write(content[0].get_text().replace('\xa0'*8,'\n\n'))except:print("失败")def getUrl(soup):server = "https://www.biqukan.com"div = soup.find_all('div', class_='listmain')# print(div)Tag_a = div[0].find_all('a')nums = len(Tag_a)for index in range(len(Tag_a)):page_url = server + Tag_a[index].get('href')name = Tag_a[index].string# print(name, page_url)downLoadPage(page_url, name)sys.stdout.write("已下载:%.3f%%" % float(index/nums) + '\r')sys.stdout.flush()if __name__  == "__main__":url = "https://www.biqukan.com/2_2758/"html = getListHTML(url)soup = BeautifulSoup(html,'lxml')getUrl(soup)

效果

python网络爬虫实战之下载笔趣看小说网小说相关推荐

  1. Python网络爬虫实战案例之:7000本电子书下载(2)

    一.前言 本文是<Python开发实战案例之网络爬虫>的第二部分:7000本电子书下载网络爬虫开发环境安装部署.配套视频课程详见网易云课堂 二.章节目录 (1)Python开发环境依赖 ( ...

  2. python商业爬虫教程_廖雪峰老师的Python商业爬虫课程 Python网络爬虫实战教程 体会不一样的Python爬虫课程...

    廖雪峰老师的Python商业爬虫课程 Python网络爬虫实战教程 体会不一样的Python爬虫课程 1.JPG (53.51 KB, 下载次数: 1) 2019-8-9 08:15 上传 2.JPG ...

  3. python爬虫文件代码大全-Python网络爬虫实战项目代码大全(长期更新,欢迎补充)...

    WechatSogou[1]- 微信公众号爬虫.基于搜狗微信搜索的微信公众号爬虫接口,可以扩展成基于搜狗搜索的爬虫,返回结果是列表,每一项均是公众号具体信息字典.[1]: https://github ...

  4. python常用代码大全-Python 网络爬虫实战项目代码大全

    原标题:Python 网络爬虫实战项目代码大全 DouBanSpider 豆瓣读书的爬虫.你可以爬豆瓣读书下面标签下的所有图书,按评分排名依次存储,存储到Excel中,可方便大家筛选搜罗,比如筛选评价 ...

  5. python基础代码大全-Python网络爬虫实战项目代码大全(长期更新,欢迎补充)

    WechatSogou[1]- 微信公众号爬虫.基于搜狗微信搜索的微信公众号爬虫接口,可以扩展成基于搜狗搜索的爬虫,返回结果是列表,每一项均是公众号具体信息字典.[1]: https://github ...

  6. Python 网络爬虫实战:去哪儿网旅游攻略图文爬取保存为 Markdown电子书

    接上回,<Python 网络爬虫实战:爬取<去哪儿>网数千篇旅游攻略数据>. 我们爬取到了数千篇的旅游攻略文章的数据. 但是事情还没有结束,对于大部分的人来讲,最希望得到的东西 ...

  7. [day4]python网络爬虫实战:爬取美女写真图片(Scrapy版)

    l> 我的新书<Android App开发入门与实战>已于2020年8月由人民邮电出版社出版,欢迎购买.点击进入详情 文章目录 1.开发环境 2.第三方库 3.Scrapy简介 4. ...

  8. [day1]python网络爬虫实战:爬取美女写真图片

    l> 我的新书<Android App开发入门与实战>已于2020年8月由人民邮电出版社出版,欢迎购买.点击进入详情 文章目录 1.开发环境 2.第三方库 3.实现 1.分析url格 ...

  9. [day2]python网络爬虫实战:爬取美女写真图片(增强版)

    l> 我的新书<Android App开发入门与实战>已于2020年8月由人民邮电出版社出版,欢迎购买.点击进入详情 文章目录 1.开发环境 2.第三方库 3.实现 1.分析url格 ...

  10. Python网络爬虫实战项目代码大全(长期更新,欢迎补充)

    Python网络爬虫实战项目代码大全(长期更新,欢迎补充) 阿橙 · 1 个月内 WechatSogou [1]- 微信公众号爬虫.基于搜狗微信搜索的微信公众号爬虫接口,可以扩展成基于搜狗搜索的爬虫, ...

最新文章

  1. 关于HtmlAgilityPack解析页面中数据乱码问题
  2. 计算机cmd入门,ODS(cmd)入门命令大全,果断收藏!!!
  3. 【建议珍藏系列】如果你这样回答「什么是线程安全」,面试官都会对你刮目相看!...
  4. Java描述设计模式(15):责任链模式
  5. cesium 局部加载_cesium自定义气泡窗口infoWindow后续优化篇 - GIS之家
  6. DTrace Tools
  7. 实战 | F1060路由模式典型组网配置案例(RIP)
  8. 数据库原理(一)—— 关系代数(二)
  9. SQL Server数据库应用技术
  10. 虚拟局域网+思科交换机基础配置学习有图简单易懂.
  11. vue2生成图片导出pdf
  12. oracle怎么关联表查询语句,Oracle数据库的多表关联查询SQL语句
  13. 从qire123上抓取bdhd下载地址的firefox extension
  14. 【GNN报告】复旦大学许嘉蓉:基于图数据的鲁棒机器学习
  15. matlab编写扫雷,MATLAB版本的扫雷小游戏
  16. 揭密备份恢复的原理!
  17. JavaScript阻止链接跳转
  18. keil MDK5.24打开MDK5.15及以前STM32工程报错Error #545:Required gpdsc file 'FrameworkCubeMX.gpdsc' is missing
  19. 加载elementor时出现问题_禁止elementor插件加载谷歌字体
  20. 7发布年份_四城联动 | 美夏成功举办魔爵红2018年份发布会及垂直年份大师班

热门文章

  1. 银行客户流失分析预测
  2. 6410裸机加载linux内核,KG—Tiny6410裸机环境搭建(补充篇)
  3. 图片隐写,盲水印,加密logo
  4. 计算过去的某天距离今天多少天
  5. hdu1013 (Digital Roots)
  6. ConfigUtil.class.getResource
  7. 目前常用的4种备份系统架构
  8. MD5 算法的加密、撞库破解及Python实现和操作演示
  9. Packet Tracer 和 Wirshark 抓取数据包
  10. 青岛地区服务器不稳定怎么办,青岛联通现大面积DNS故障 用户该如何上网