运行无反应,也不报错,啥毛病??

import xlwt
import requests
from lxml import etree
import timeall_info_list=[]
def get_info(url):html=requests.get(url)selector=etree.HTML(html.text)infos=selector.xpath('//ul[@class="all_img_list cf"]/li')for info in infos:title=info.xpath('div[2]/h4/a/text()')[0]author=info.xpath('div[2]/p[1]/a[1]/text()')[0]style_1=info.xpath('div[2]/p[1]/a[2]/text()')[0]style_2=info.xpath('div[2]/p[1]/a[3]/text()')[0]style=style_1+'.'+style_2complete=info.xpath('div[2]/p[1]/span[1]/text()')introduce=info.xpath('div[2]/p[2]')[0].strip()word=info.xpath('div[2]/p[3]/span/span[1]/text()')[0].strip('万字')info_list=['title','author','style','complete','imtroduce','word']all_info_list.append(info_list)time.sleep(3)
if __name__=="__main__":urls=['https://www.qidian.com/all?page={}'.format(str(i)) for i in range(1,29655)]for url in urls:get_info(url)header=['title','author','style','complete','introduce','word'] book=xlwt.Workbook(encoding='utf-8')sheet=book.add_sheet('Sheet1')for h in range(len(header)):sheet.write(0,h,header[h])i=1for list in all_info_list:j=0for data in list:sheet.write(i,j,data)j+=1i+=1
book.save('H:/python/xiaoshuo.xls')            

爬取起点中文网的小说相关推荐

  1. python爬虫怎么爬小说_Python 新手] 爬虫练习:爬取起点中文网的小说排行并存入 excel 表格中...

    使用的 python 库 1.request 库,用于向服务器发起请求信息. 2.lxml 库,用于解析服务器返回的 HTML 文件. 3.time 库,设置爬取时间差,防止短时间内多次页面请求而被限 ...

  2. python 爬虫抓取网页数据导出excel_Python爬虫|爬取起点中文网小说信息保存到Excel...

    前言: 爬取起点中文网全部小说基本信息,小说名.作者.类别.连载\完结情况.简介,并将爬取的数据存储与EXCEL表中 环境:Python3.7 PyCharm Chrome浏览器 主要模块:xlwt ...

  3. python爬虫之爬取起点中文网小说

    python爬虫之爬取起点中文网小说 hello大家好,这篇文章带大家来制作一个python爬虫爬取阅文集团旗下产品起点中文网的程序,这篇文章的灵感来源于本人制作的一个项目:电脑助手 启帆助手 ⬆是项 ...

  4. Python爬虫之爬取起点中文网

    python之爬取起点中文网 最近学了爬虫,想实战一下就选取了最近经常看小说的起点中文网来进行爬取 过程如下: 分析爬取信息: 爬取网址:https://www.qidian.com/rank?chn ...

  5. scrapy爬取起点中文网24小时热销榜单

    系列文章目录 第一章 scrapy爬取起点中文网24小时热销榜单. 文章目录 系列文章目录 前言 一.项目需求 二.项目分析 三.程序编写 1.编写item(数据存储) 2.编写spider(数据抓取 ...

  6. scrapy 爬取起点中文网首页的本周强推作品的详情介绍

    scrapy 爬取起点中文网首页的每周强推作品的详情介绍 从列表页跳转到详情页 保存的数据 封面图 小说名 作者 类型 简介 import scrapy# 起点首页 本周推荐 class Weektj ...

  7. Go爬取起点中文网 解决文字反爬

    Go语言的爬虫库不如Python强大,却也五脏俱全. 今天我们分析如何爬取起点中文网数据,以及遇到反爬如何处理. 作品链接:http://www.365yg.com/i6678092837810078 ...

  8. Scrapy 爬取起点中文网存储到 MySQL 数据库(自定义 middleware)

    Scrapy 爬取起点中文网 1. 创建项目 2. 创建爬虫实例 3. 创建一个启动文件 main.py 4. 项目的总体树结构 5. settings.py 6. items.py 7. qidia ...

  9. python爬虫之爬取起点中文原创小说排行榜

    学习python有段时间了,最近做了一个网上爬虫工具爬取起点中文原创小说排行榜数据,作为最近学习python的一个阶段性成果. 工具 对于做网络爬虫工具经常用到的就是chrome浏览器,主要用于抓取网 ...

最新文章

  1. 设CPU中各部件及其相互连接关系如下图所示。图中W是写控制标志,R是读控制标志,R 1 和R 2 是暂存器
  2. 数据智能构建管理平台Dataphin V2.9.4.3版本发布
  3. 限制 TEdit 只能接收 数字 输入...
  4. 小米路由器 梅林_WIFI6真的有用吗?小米ALOT路由器AX3600上手体验!小米智能家居生态之选及选购分析...
  5. 可重复锁ReentrantLock原理分析
  6. 拯救深度学习:标注数据不足下的深度学习方法
  7. 远程桌面连接无法相互拷贝文件了?
  8. PHP面向对象设计模式-姜海强-专题视频课程
  9. 关于vue自定义事件中,传递参数的一点理解
  10. 阿里矢量图可根据样式修改颜色
  11. 根据经纬度计算两地之间的距离
  12. 2020年证券从业资格考试《金融市场基础知识》真题汇编卷一
  13. hdu 5455 Fang Fang
  14. 暴雪插件占用服务器,你还在用这款插件吗?暴雪公布《魔兽世界》怀旧服卡顿原因...
  15. win7快速启动栏计算机,windows7快速启动栏如何设置 windows7快速启动栏设置方法【图文】...
  16. Android系统10 RK3399 init进程启动(十七) Verbose日志级别打开方式
  17. 2021-05-11 MongoDB面试题 MongoDB中的命名空间是什么意思
  18. 这些有趣的Python库一定会亮到你
  19. 在中国有什么办法可以开通摩根大通银行?
  20. 回到1996,一起领略 JavaBeans 的真正力量

热门文章

  1. 好评返现如何摆脱平台规则和流量限制
  2. saber 2.7.1 maven 配置
  3. html 高度塌陷,前端高度塌陷问题
  4. 【语音去噪】基于最小二乘自适应滤波LMS和RLS实现语音去噪含Matlab源码
  5. 添加按钮声音nbsp;nbsp;播放声音
  6. 关于互联网时代的自助旅游
  7. 2020年就要过去了,我们决定用这种方式记住它
  8. 【软件构造】实验一的心得体会
  9. 关系数据库语言SQL课后练习题(二)
  10. linux上数据库账号被锁定,ORA-28000账户被锁和解锁