爬取豆瓣音乐并写入excel

from urllib.request import urlopen,Request
from bs4 import BeautifulSoup
import time
import xlwt
titles=[]
time_list=[]
attribute_list=[]
zhuanji_list=[]
score=[]
headers={'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64; rv:6.0) Gecko/20100101 Firefox/6.0'}
workbook=xlwt.Workbook(encoding='utf-8')
worksheet=workbook.add_sheet("豆瓣音乐top250")
def updateurl(url,headers):ret=Request(url,headers=headers)html=urlopen(ret)bs=BeautifulSoup(html,"html.parser")return bs
for i in range(0,11):time.sleep(1)url="https://music.douban.com/top250?start={}".format(i*25)bs=updateurl(url,headers)title=bs.find("div",{"id":"wrapper"})for tt in title.find_all("a",{'class':'nbg'}):titles.append(tt.find('img')['alt'])for aa in title.find_all("p",{'class':'pl'}):att=aa.get_text().split("/")time_list.append(att[1])attribute_list.append(att[-2])try:zhuanji_list.append(att[-1])except:zhuanji_list.append(" ")for yy in title.find_all("span",{'class':'rating_nums'}):score.append(yy.get_text())# print(score)
worksheet.write(0,0,label='作曲者+音乐名')
worksheet.write(0,1,label='发行时间')
worksheet.write(0,2,label='属性名')
worksheet.write(0,3,label='类型')
worksheet.write(0,4,label='评分')
for d in range(0,len(titles)):worksheet.write(d+1,0,label=titles[d])worksheet.write(d+1,1,label=time_list[d])worksheet.write(d + 1, 2, label=attribute_list[d])worksheet.write(d + 1, 3, label=zhuanji_list[d])worksheet.write(d + 1, 4, label=score[d])
workbook.save('豆瓣音乐top250.xls')

爬取豆瓣音乐top250相关推荐

  1. Python爬虫学习之爬取豆瓣音乐Top250存入Excel表格中

    前言 目标网站:https://music.douban.com/top250 任务: 爬取豆瓣音乐Top250的歌曲名 爬取豆瓣音乐Top250的歌曲对应的表演者.发行时间和音乐流派(分别对应下图斜 ...

  2. 爬虫练习-爬取豆瓣音乐TOP250的数据

    前言: 爬取豆瓣音乐TOP250的数据,并将爬取的数据存储于MongoDB中 本文为整理代码,梳理思路,验证代码有效性--2020.1.1 环境: Python3(Anaconda3) PyCharm ...

  3. python实例豆瓣音乐代码_Python爬虫实战(3)-爬取豆瓣音乐Top250数据(超详细

    前言 首先我们先来回忆一下上两篇爬虫实战文章: 第一篇:讲到了requests和bs4和一些网页基本操作. 第二篇:用到了正则表达式-re模块 今天我们用lxml库和xpath语法来爬虫实战. 1.安 ...

  4. 利用python爬取豆瓣音乐_Python爬虫小白入门(七)爬取豆瓣音乐top250

    抓取目标: 豆瓣音乐top250的歌名.作者(专辑).评分和歌曲链接 使用工具: requests + lxml + xpath. 我认为这种工具组合是最适合初学者的,requests比python自 ...

  5. 爬取豆瓣音乐TOP250并写入Excel

    爬取豆瓣音乐写入Excel from urllib.request import Request, urlopen import bs4 import requests import re impor ...

  6. 爬取豆瓣音乐TOP250数据保存到csv文件和xls文件

    爬取的目标网址:https://music.douban.com/top250 利用lxml库,获取前10页的信息,需要爬取的信息包括歌曲名.表演者.流派.发行时间.评分和评论人数,把这些信息存到cs ...

  7. python爬取音乐_Python现学现用xpath爬取豆瓣音乐

    昨天说了Requests库,今天来上手爬虫了. 爬虫的抓取方式有好几种,正则表达式,Lxml(xpath)与BeautifulSoup,我在网上查了一下资料,了解到三者之间的使用难度与性能 三种爬虫方 ...

  8. 案例:爬取豆瓣电影Top250中的电影信息

    案例:爬取豆瓣电影Top250中的电影信息 豆瓣电影Top250首页 分析请求地址 在豆瓣电影Top250首页的底部可以确定电影信息一共有10页内容,每页25个电影信息,如下图: 切换页面,可以看到浏 ...

  9. Python爬虫:现学现用xpath爬取豆瓣音乐

    爬虫的抓取方式有好几种,正则表达式,Lxml(xpath)与BeautifulSoup,我在网上查了一下资料,了解到三者之间的使用难度与性能 三种爬虫方式的对比. 这样一比较我我选择了Lxml(xpa ...

最新文章

  1. java字符串复制空值_Java脚本:去除字符串中空值
  2. 转 linux进程内存到底怎么看 剖析top命令显示的VIRT RES SHR值
  3. 我们又双叒搬家了!(附福利)
  4. 看了这个高并发系统架构,才知道我对秒杀的误解有多深
  5. SAP CRM WebClient UI搜索结果界面的扩展字段显示
  6. OPENSSL 的深入理解
  7. linux shell调用c 程序设计,linux – 在bash -c中设置变量
  8. 20171113_Python学习五周一次课
  9. ​深度学习基础 | Seq2seq+Attention
  10. react-native 自定义 下拉刷新 / 上拉加载更多 组件
  11. spring源代码分析
  12. 机房管理降本增效:Hightopo如何将可视化监控做到行业高阶?
  13. 【LeetCode】第934题——最短的桥(难度:中等)
  14. tibco rv java实例_Tibco介绍及应用.pptx
  15. 组成原理 - 内存颗粒分类(ram,rom)
  16. 读《Machine Learning Done Wrong》(机器学习易犯错误)有感
  17. java主色调_主色调
  18. 快手也抢先字节出手了…
  19. Android N 指纹框架
  20. java中已实现的md5加密

热门文章

  1. 华为数通工程师面试笔记
  2. Lintcode 背包专题:最小调整代价,杆子分割,换硬币
  3. 无向图的关联矩阵JAVA_无向图的关联矩阵有哪些特征
  4. python背景图颜色_matplotlib作图,刻度和背景颜色
  5. php cms 源码小说,PHPMAOS 强大的小说CMS系统
  6. vue引入three.js3维地图_vue-chartjs使用 Chart.js 和 Vue.js 搭建简单和漂亮的图表
  7. Proteus:单片机用按键控制LED的亮灭
  8. nginx+fastcgi+flask延时分段返回数据
  9. 微信小程序和python数据交互_记录 python flask 与微信小程序交互
  10. 支付宝安全控件为什么常驻那么多进程?