酷狗音乐top500榜单就是我们今天需要爬取的对象,作为新手入门的代码,只需要将信息爬取下来即可,十分简单,不需要保存到数据库或保存到文件,仅当普通练习。
https://www.kugou.com/yy/rank/home/1-8888.html?from=rank

我们主要利用requests库和BeautifulSoup解析库

1.站点分析

下面是第一页和第二页的请求,很容易发现只需要改变home后面的数据即可翻页(别管底下的下载客户端)。

并且根据数量推断出有23页。

2.主要模块

  • 构造多页URL
 # 构造多页URL
urls = ['http://www.kugou.com/yy/rank/home/{}-8888.html'.format(str(i)) for i in range(1,24)]
  • 获取信息 排行、歌手名、歌曲名、歌曲时长。
 soup = BeautifulSoup(wb_data.text, 'lxml')ranks = soup.select('span.pc_temp_num')  # 排行titles = soup.select('div.pc_temp_songlist > ul > li > a')  times = soup.select('span.pc_temp_tips_r > span')  # 歌曲时长

3.代码

import requests
from bs4 import BeautifulSoupheaders={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36''(KHTML, like Gecko) Chrome/79.0.3945.130 Safari/537.36'
}def get_data(url):data=requests.get(url=url,headers=headers)soup=BeautifulSoup(data.text,"lxml")ranks=soup.select('span.pc_temp_num') #排名titles = soup.select('div.pc_temp_songlist > ul > li > a')  # 歌手名和歌曲名times=soup.select('span.pc_temp_time')  #时长for rank, title, time in zip(ranks, titles, times):data = {'rank': rank.get_text().strip(),'singer': title.get_text().split('-')[0],'song': title.get_text().split('-')[1],  # 通过split获取歌手和歌曲信息'time': time.get_text().strip()}print(data)if __name__=='__main__':urls = ['http://www.kugou.com/yy/rank/home/{}-8888.html'.format(str(i)) for i in range(1,24)]for url in urls:get_data(url)  # 循环调用get_data()函数

运行结果截图:

python爬虫-爬取酷狗音乐top榜相关推荐

  1. Python爬虫爬取酷狗音乐TOP500

    Python大作业 内容简介: 用Python来爬取酷狗音乐TOP500的歌曲信息,统计这500首歌曲中出现的所有歌手,并做可视化处理生成词云 实验代码: import time import req ...

  2. python爬虫——爬取酷狗音乐top500(BeautifulSoup使用方法)

    酷狗音乐Top500 酷狗top500http://www.kugou.com/yy/rank/home/1-8888.html?from=rank 进入,并按F12打开开发者工具(本文以火狐浏览器为 ...

  3. python爬虫爬取酷狗音乐

    老规矩,代码先行 # -*- codeing = utf-8 -*- # @Time : 2021/2/25 13:17 # @Author : 老七疯狂吸氧 # @file 酷狗音乐.py # @S ...

  4. 爬取酷狗音乐TOP榜所有的歌曲信息

    一. 构造url: 1. 进入酷狗音乐官方网站,点击酷狗TOP500,查看浏览器地址栏 可以看到地址为https://www.kugou.com/yy/rank/home/1-8888.html?fr ...

  5. Python爬虫 爬取酷狗TOP500的数据

    根据书籍<从零开始学Python网络爬虫>P41,综合案例2-爬取酷狗TOP500的数据修改而来. 使用模块requests和模块BeautifukSoup进行爬取. 不得不说,酷狗拿来跑 ...

  6. python爬虫爬取酷狗top5001

    前言 这段时间正在学习python爬虫,今天分享一个关于酷狗音乐top500的爬虫 python库 标准库 time 第三方库 requests库 BeautifulSoup库 自建库 agent库( ...

  7. Python爬虫之爬取酷狗音乐歌曲

    Python爬虫之爬取酷狗音乐歌曲 1.安装第三方库 在Python的语言库中, 分为Python标准库和Python的第三方库. Python标准库是在你安装Python的时候已经包含在了安装目录下 ...

  8. Python爬虫入门——2. 2爬取酷狗音乐top1-500歌曲信息

    有了第一个程序的基础,我们现在来爬取酷狗音乐top500的歌曲信息.连接http://www.kugou.com/yy/rank/home/1-8888.html 我们第一个程序只爬取了一个页面的数据 ...

  9. Python爬虫案例:爬取酷狗音乐全排行榜歌曲

    前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理 本次目标 爬取酷狗音乐全站排行榜歌曲 目标地址 https://www.ku ...

最新文章

  1. python处理excel大数据-【Python 模块】 xlrd 读取 Excel 文件
  2. linux记录iptables日志,iptables日志管理
  3. python之setdefault()和defaultdict()处理缺失值的键
  4. 2018最佳GAN论文回顾(下)
  5. python爬取百度域名注册_python爬取百度域名_python爬取百度搜索結果url匯總
  6. cef 前进后台 实现_CefSpider: 一个基于Webkit,Cef框架构建爬虫,项目代号:“车风”,具备浏览器所有特性,欢迎你给我一个Star,你的Star是该项目前进的动力!...
  7. 【Java程序设计】多线程进阶
  8. 善领dsa2020最新车机ce版_理想汽车回应碰撞事故 硬件升级计划将推出OTA 2.0版
  9. 操作系统( 第二章)知识点总结
  10. Kaggle共享单车需求项目详解
  11. 等比求和模版,下标从1开始
  12. 一个上海同济大学教师的工资单(zt tianya)
  13. C#注册和注销全局快捷键
  14. DNS之胶水记录Glue Record【转载】
  15. PLD PLA PAL GAL
  16. 唯一约束和主键约束的区别
  17. 时间管理黄金法则笔记
  18. windows 8 新登陆方式(图片密码、Pin码)
  19. 数字时代,原创者应该如何借助区块链技术保护知识产权?
  20. 公众号运营引流月吸万粉之互推

热门文章

  1. React HOOK 自定义拍照画面,自动截取指定画面
  2. java实现字符串中的单词分别反转,如how are you ?==ohw rae oyu ?
  3. 使用JS实现三级联动
  4. macbook m1 JDK环境与AndResGuard编译遇到的Gradle同步报错
  5. LaTeX中的计数器
  6. 小程序仿钉钉分享打卡日历实现
  7. Go数据结构与算法-双向链表
  8. 如何用记事本编写java
  9. 《硬核父母的五项修炼》思维导读
  10. 如何关闭页面之前清空LocalStorage