python爬取豆瓣排行榜电影数据(含GUI界面版)
前言
本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理。
PS:如有需要Python学习资料的小伙伴可以加点击下方链接自行获取
python免费学习资料以及群交流解答点击即可加入
项目简介
这个项目源于大三某课程设计。平常经常需要搜索一些电影,但是不知道哪些评分高且评价人数多的电影。为了方便使用,就将原来的项目重新改写了。当做是对爬虫技术、可视化技术的实践了。主要是通过从排行榜和从影片关键词两种方式爬取电影数据。
配置说明
打开http://chromedriver.storage.googleapis.com/index.html,根据自己的操作系统下载对应的chromedriver
打开当前面目录下的**getMovieInRankingList.py**,定位到第59行,将executable_path=/Users/bird/Desktop/chromedriver.exe修改成你自己的chromedriver路径
打开pycharm,依次安装以下包
pip install Pillow
pip install selenium
功能截图
包含功能
根据关键字搜索电影
根据排行榜(TOP250)搜索电影
显示IMDB评分及其他基本信息
提供多个在线视频站点,无需vip
提供多个云盘站点搜索该视频,以便保存到云盘
提供多个站点下载该视频
完整代码
python爬取豆瓣排行榜电影数据(含GUI界面版)相关推荐
- 【Python实战】爬取豆瓣排行榜电影数据(含GUI界面版)
项目简介 这个项目源于大三某课程设计.平常经常需要搜索一些电影,但是不知道哪些评分高且评价人数多的电影.为了方便使用,就将原来的项目重新改写了.当做是对爬虫技术.可视化技术的实践了.主要是通过从排行榜 ...
- python爬取豆瓣排行榜电影(静态爬取)(二次爬取)
目录 python爬取豆瓣排行榜电影(静态爬取) 获取网站url 获取网站headers get请求访问url BeautifulSoup解析网站 爬取html数据 完整代码 python爬取豆瓣排行 ...
- 爬取豆瓣排行榜电影数据
进入豆瓣排行榜喜剧模块页面,我们想要获取其电影数据,首先肯定不能直接对当前url发起请求,因为这样获取的将会是整个页面数据,而不是单纯的电影数据. 经过观察发现该页面可以往下拖动页面而更新电影,所以猜 ...
- scrapy爬取豆瓣top250电影数据
scrapy爬取豆瓣top250电影数据 scrapy框架 Scrapy是一个为了爬取网站数据,提取结构性数据而编写的应用框架. 可以应用在包括数据挖掘,信息处理或存储历史数据等一系列的程序中. sc ...
- Python爬取豆瓣Top250电影中2000年后上映的影片信息
Python爬取豆瓣Top250电影中2000年后上映的影片信息 前言 双十一前加在京东购物车的一个东西,价格330,Plus会员用券后差不多310.双十一当天打开看了下399,还得去抢满300减10 ...
- Python爬取豆瓣Top250电影可见资料并保存为excel形式
Python爬取豆瓣Top250电影可见资料并保存为excel形式 利用requests第三方库实现网页的元素爬取,再使用openpyxl库进行信息的录入. 具体思路 1.分析网页的headers. ...
- python 爬取豆瓣top100电影页面
python 爬取豆瓣top100电影页面 运行结果截图: 代码: (原网站:https://movie.douban.com/top250) 1.将页面保存 避免多次访问 (登陆状态需页面cooki ...
- 数据分析与挖掘案例之使用python抓取豆瓣top250电影数据进行分析
使用python抓取豆瓣top250电影数据进行分析 抓取豆瓣Top250电影数据的链接和电影名称 代码如下: import urllib.request as urlrequest from bs4 ...
- python 豆瓣评论分析方法_使用python抓取豆瓣top250电影数据进行分析
抓取豆瓣Top250电影数据的链接和电影名称 代码如下: import urllib.request as urlrequest from bs4 import BeautifulSoup impor ...
最新文章
- Golang中的panic和recover(捕获异常)
- 使用IDEA基于Maven搭建多模块聚合工程(springmvc+spring+mybatis整合)
- Linux C:管道的实现原理,命名管道
- OpenCV转换PyTorch分类模型并使用OpenCV Python启动
- Spring @Aspect切面参数传递
- 新突破!CVPR2019接收论文:新的基于自编码变换的无监督表示学习方法—AET
- 语言程序推箱子课设报告_“延期不延学”第13期 | C++篇 | c++课设建议
- 两轮差速机器人舵机转轴示意图_灵活、快捷的机房巡检机器人少不了伺服电动轮...
- Flutter ContrainedBox
- spoonwep下载地址
- js return加分号_js分号的重要性
- gst-launch-1.0用法小记
- 联想微型计算机怎么调亮度,联想笔记本如何调节亮度和音量
- 使用工具Android Studio实现一个简单的Android版的新闻APP
- 日渐临近的苹果秋季发布会,iOS 11 GM 固件到底提前泄露了哪些秘密?
- 阿里云服务器可以更ip吗?
- php unhtml包,JavaScript 版本的 PHP serialize/unse_js
- oracle官方网址
- LOB大字段空间整理
- 算法的浪漫 - 相交链表
热门文章
- 如何给高中生讲微分方程(超基础)
- 杭电计算机学院复试真题,2020杭州电子科技大学计算机学院考研复试公告
- CSS捉迷藏剧本杀情感,五百本剧本杀骨灰玩家剧本推荐——情感沉浸篇
- 信息系统管理工程师 - 2017年真题(下午卷,应用技术)考点解析
- 骑行用什么蓝牙耳机好?骑行骨传导耳机推荐
- 第一次连接服务器要求修改密码--XShell Changing password for root. (current) UNIX password
- 作业:山姆公司相开展“会员制营销”和“EMAIL营销”
- 一键还原软件 简简单单恢复你的系统
- 微擎inc.php 读不到,解读微擎之----bootstrap.inc.php
- 《Spring Cloud与Docker微服务架构实战》读书笔记