转自:http://www.baobaoshequ.com/article/4630

运行结果:

第一次运行爬取了40首歌,第一个for循环 for i in range(0,2)把前两页共40首歌全部爬取下来了。

第二次运行爬取了120首歌,我加了一行代码page=int(input("请输入您要爬取的页码:"))第二个for循环 for i in range(0,page),企图爬取所有的音乐,但是在Python自带的IDE无法运行,提示没有ruquests库。后面我把for循环改成for i in range(0,20)企图爬完所有的音乐结果只爬取下来120歌(一共380首),触发了网页的反爬虫机制,无法爬后面的歌了。

第三次运行爬取了40首歌,我引入了random模块把0最后一行time.sleep(0.5)改成a=random.random()(随机生成0-1的数字)\time.sleep(a)这样的两行企图破了网站的反爬虫机制,结果只爬取了40首,还是触发了网站的反爬虫机制。

第四次运行爬取了20首音乐,我调回如图的程序代码,20首后触发了网站的反爬虫机制,在后面我的爬虫就完全失效了。

遇到的问题:

1、我通过pip install ruquests安装了ruquests库为什么不运行程序?我电脑安装了pycharm、python3.7以及anconda最新版本。

2、如何才能不触发网站的反爬虫机制?

简单写一个python爬虫程序:爬取音乐资源相关推荐

  1. 五分钟写一个小爬虫,爬取小说并写入txt文件

    先上代码: #-*- coding:UTF-8 -*- import requests from lxml import html url='http://www.shuge.net/html/111 ...

  2. 10-24-程序员日-我的第一个python爬虫项目-爬取蜂鸟上的图片

    今天是诸位程序员的节日,为了1024勋章,我这个菜鸟也来发个博客 网络爬虫(又被称为网页蜘蛛,网络机器人)就是模拟浏览器发送网络请求,接收请求响应,一种按照一定的规则,自动地抓取互联网信息的程序. 在 ...

  3. 第一次写爬虫程序爬取豆瓣5W条电影数据

    第一次写爬虫程序爬取豆瓣5W条电影数据 最近工作比较不是很忙,想到之前使用httpclient和jsoup爬取过一次豆瓣电影TOP250,但总觉得数据量太小,不过瘾.于是趁着最近不是很忙的机会,重新写 ...

  4. Python 爬虫 之 爬取古代的诗歌,并保存本地(这里以爬取李白的所有诗歌为例)(以备作为AI写诗的训练数据)

    Python 爬虫 之 爬取古代的诗歌,并保存本地(这里以爬取李白的所有诗歌为例)(以备作为AI写诗的训练数据) 目录

  5. python爬虫都能干什么用_5 行代码就能写一个 Python 爬虫

    欢迎关注我的公众号:第2大脑,或者博客:高级农民工,阅读体验更好. 摘要:5 行代码就能写一个 Python 爬虫. 如果你是比较早关注我的话,会发现我此前的大部分文章都是在写 Python 爬虫,前 ...

  6. python爬虫能爬取微信密码吗_爬虫如何爬取微信公众号文章

    下篇文章:python爬虫如何爬取微信公众号文章(二) 下下篇连接python爬虫如何实现每天爬取微信公众号的推送文章 因为最近在法院实习,需要一些公众号的数据,然后做成网页展示出来便于查看,之前我倒 ...

  7. python爬虫之爬取捞月狗直播信息

    诶,本人一个大三真皮沙发男.最近迷上了斗鱼大司马,这个就很有意思,你知道吧. 就想写一个python爬虫来搞一波事情,觉得捞月狗这个平台还不错,就花了点时间写了一个用pyqt5做UI界面的爬虫.顿时就 ...

  8. python爬虫实战---爬取大众点评评论

    python爬虫实战-爬取大众点评评论(加密字体) 1.首先打开一个店铺找到评论 很多人学习python,不知道从何学起. 很多人学习python,掌握了基本语法过后,不知道在哪里寻找案例上手. 很多 ...

  9. python爬虫之爬取网页基础知识及环境配置概括

    记:python爬虫是爬取网页数据.统计数据必备的知识体系,当我们想统计某个网页的部分数据时,就需要python爬虫进行网络数据的爬取,英文翻译为 spider 爬虫的核心 1.爬取网页:爬取整个网页 ...

最新文章

  1. thinkphp模型中的获取器和修改器(根据字段名自动调用模型中的方法)
  2. 虚拟机安装CentOS 5.5详细过程和上网配置
  3. 100. 增减序列【差分 / 思维】
  4. vxworks的default boot line说明
  5. python列表总结
  6. 在树莓派3B+ 上使用YOLO v3 Tiny进行实时对象检测
  7. 简单了解关于.net framework的一些常见问题
  8. HDU2561 第二小整数【水题+序列处理】
  9. css的鼠标手势大全
  10. GRE常见的熟词生义
  11. HTTP代理是什么意思?
  12. 网络层HTPPS和HTTP的概念与区别
  13. RAC 11G ASM磁盘损坏恢复
  14. 项目人生,成长与感悟
  15. 解决github提交项目是出现10053的问题
  16. Matlab三维离散点曲面拟合
  17. 如何取消(或关闭)win2003中的ie增强安全配置
  18. Http中post/get请求参数接收
  19. CSS3-弹性盒子模型
  20. 奔腾PLFE5001电压力锅

热门文章

  1. 【前端】从零开始读懂Web3
  2. 简谈caffe中的LRN层
  3. mysql gprof_MySql的CMake选项支持gcov和gprof
  4. win7每次重启后,默认网关都会消失,如何处理
  5. 强制关闭一个进程TerminateProcess
  6. python运行pyc文件_Python什么情况下会生成pyc文件?
  7. Freenas硬件需求
  8. 错误代码0xc0000001要怎么解决?如何修复错误
  9. 汇丰银行java框架_汇丰银行面试经历(IT类).doc
  10. 201海淀区计算机知识竞赛题,第二届计算机知识竞赛试题