这次我们来学习爬去猫眼电影前100名的电影

1.首先我们打开猫眼电影top100的网页:http://maoyan.com/board/4?

我们发现有offset=页数,来进行翻页


2.我们打开pycham编程软件,我们创建一个项目,然后新建一个文件sprider.py

import requests
from requests.exceptions import RequestException
import re
import json
#多线程,一秒完成数据的爬取
from multiprocessing import Pooldef get_one_page(url):try:response = requests.get(url)if response.status_code == 200:return response.textreturn Noneexcept RequestException:return Nonedef parse_one_page(html):pattern = re.compile('<dd>.*?board-index.*?>(\d+)</i>.*?data-src="(.*?)".*?name"><a'+'.*?>(.*?)</a>.*?star">(.*?)</p>.*?releasetime">(.*?)</p>'+'.*?integer">(.*?)</i>.*?fraction">(.*?)</i>.*?</dd>',re.S)items = re.findall(pattern,html)for item in items:yield {'index': item[0],'image': item[1],'title': item[2],'actor': item[3].strip()[3:],'time': item[4].strip()[5:],'score': item[5]+item[6]}def write_to_file(content):with open('result.txt','a',encoding='utf-8') as f:f.write(json.dumps(content,ensure_ascii=False)+'\n')f.close()def main(offset):url = "http://maoyan.com/board/4?offset="+str(offset)html = get_one_page(url)for item in parse_one_page(html):print(item)write_to_file(item)if __name__=='__main__':# for i in range(10):#     main(i*10)pool = Pool()pool.map(main,[i*10 for i in range(10)])

3.然后运行我们的项目,如图所示:


4.我们把爬取的数据保存到文本中


     猫眼电影的top100就这样被爬取下来了:



小白学python-实战-爬取猫眼电影信息相关推荐

  1. 爬虫基本库request使用—爬取猫眼电影信息

    使用request库和正则表达式爬取猫眼电影信息. 1.爬取目标 猫眼电影TOP100的电影名称,时间,评分,等信息,将结果以文件存储. 2.准备工作 安装request库. 3.代码实现 1 imp ...

  2. python爬虫爬取豆瓣电影信息城市_Python爬虫入门 | 2 爬取豆瓣电影信息

    这是一个适用于小白的Python爬虫免费教学课程,只有7节,让零基础的你初步了解爬虫,跟着课程内容能自己爬取资源.看着文章,打开电脑动手实践,平均45分钟就能学完一节,如果你愿意,今天内你就可以迈入爬 ...

  3. Python爬虫爬取猫眼电影风语咒影评评论信息

    风语咒作为扛起国漫崛起的又一国漫之作,爬取风语咒猫眼的电影评论数据,以便对其评论做之后的数据分析. 此次demo的流程图如下: 一.找到猫眼电影中风语咒影评得json数据: l 找出url后,往下滚动 ...

  4. python爬虫--爬取-猫眼电影-代码

    import re import requests class Mao():def __call__(self, *args, **kwargs):"""当前类的对象当做 ...

  5. python爬虫 爬取猫眼电影数据

    # 定义一个函数获取猫眼电影的数据​ import requestsdef main():url = url = 'http://maoyan.com/board/4?offset=0'html = ...

  6. python爬虫爬取豆瓣电影信息城市_python爬虫,爬取豆瓣电影信息

    hhhhh开心,搞了一整天,查了不少python基础资料,终于完成了第一个最简单的爬虫:爬取了豆瓣top250电影的名字.评分.评分人数以及短评. 代码实现如下:#第一个最简单的爬虫 #爬取了豆瓣to ...

  7. Python使用asyncio+aiohttp异步爬取猫眼电影专业版

    asyncio是从pytohn3.4开始添加到标准库中的一个强大的异步并发库,可以很好地解决python中高并发的问题,入门学习可以参考官方文档 并发访问能极大的提高爬虫的性能,但是requests访 ...

  8. Python爬虫实战案例一:爬取猫眼电影

    背景 笔者上一篇文章<基于猫眼票房数据的可视化分析>中爬取了猫眼实时票房数据,用于展示近三年电影票房概况.由于数据中缺少导演/演员/编剧阵容等信息,所以爬取猫眼电影数据进行补充.关于爬虫的 ...

  9. Python爬虫实战Pro | (1) 爬取猫眼电影Top100榜单

    在本篇博客中,我们将使用requests+正则表达式来爬取猫眼电影官网的TOP100电影榜单,获取每部电影的序号,片名,主演,上映日期,评分和封面等内容. 之前在Python爬虫实战(1)中我们曾爬取 ...

最新文章

  1. ui产品小结 - 包含小程序 前端等
  2. linux查看虚拟内存和cpu占用率
  3. c大小写转换函数_Excel中的大小写金额转换,技巧法和函数法,职场必学技巧
  4. Android安全开发之安全使用HTTPS
  5. 【最详细】BFPRT算法:时间复杂度O(n)求第k小的数字
  6. SQL Server CDC配合Kafka Connect监听数据变化
  7. IAP-应用内购买流程
  8. ipad如何连接电脑_台式电脑如何连接蓝牙耳机
  9. Magento国家代码缩写
  10. ios frame和bounds区别
  11. 巴比特 | 元宇宙每日必读:数字藏品二级市场乱象丛生,00后成新韭菜,监管迫在眉睫?...
  12. DFRobot高精度低功耗数字温湿度传感器SHT40
  13. 学3d建模和计算机编程,超好用的3D建模软件全科普,想要学好建模的你千万别错过!...
  14. 面对封号潮,跨境收款如何做到不受牵连?
  15. 上传图片到php服务器
  16. 【数字设计】沐曦科技_笔试题目分享
  17. [JVM]了断局: 虚拟机字节码指令表速查
  18. 从皮亚诺公理体系到1+1=2的严格证明(一)
  19. QNX下音频解码器SGTL5000驱动的调试
  20. 谷歌回归中国又一招:在深圳开设办事处,推出Cloud AutoML里程碑产品

热门文章

  1. 单元测试框架——Junit5
  2. 一键免费自动AI抠图,效果连PS大哥也点赞!
  3. java中文文档docset_Docset文档制作教程
  4. 连锁超市如何部署远程监控系统
  5. Eclipse使用Maven插件的介绍
  6. 招全奖博士!UNC Charlotte招收机器人/强化学习/控制博士
  7. Metasploit -- 辅助模块(Auxiliary)
  8. 我在北上广混得不怎么样,可我不想离开
  9. 计算机专业如何开展课程思政,浙江大学城市学院计算机与计算科学学院 教学办 大讨论|计算学院计算机和软工系开展课程思政大讨论...
  10. 项​目​经​理必知的75条建议