基于Python 爬虫的Mooc Downloader

1. 项目简介:
  • 项目环境为 Windows10, Python3
  • 用 Python3.6 urllib3 模块爬虫,所有涉及模块均为标准库,打包后体积小,不到10M
  • 支持Mooc视频,字幕,课件下载,课程以目录树形式下载到硬盘,支持Potplayer播放
  • 支持中国大学慕课和爱课程二大慕课网站的视频课程,核心下载调用 Aria2c
  • 该项目可在 Github上搜 Mooc_Downloader 即可找到~
2. 功能演示:

4.项目文件
  • Mooc_Main.py 整个项目的主程序, 其实是调用了 Mooc_Interface

  • Mooc_Interface.py 人机交互接口模块

  • Mooc_Config.py Mooc 的配置文件

  • Mooc_Base.py Mooc 抽象基类

  • Mooc_Potplayer.py 用于生成专用于 Potplayer 播放的 dpl 文件

  • Mooc_Request.py 用 urllib 包装的一个Mooc请求库

  • Mooc_Download.py 调用 Aira2c 下载的命令接口

  • Icourses 有关爱课程的模块包

    • Icourse_Base.py 爱课程下载器的基类,继承自 Mooc_Base
    • Icourse_Config.py 配置文件
    • Icourse_Cuoc.py 爱课程视频公开课的下载的子类
    • Icourse_Mooc.py 爱课程资源共享课的下载的子类
  • Icourse163 有关中国大学慕课的模块包

    • Icourse163_Base.py 中国大学慕课下载器的基类,继承自 Mooc_Base
    • Icourse163_Config.py 配置文件
    • Icourse163_Mooc.py 中国大学慕课下载器得子类,继承自 Icourse163_Base.py
5.运行项目

请确保在项目工程的根目录下,然后在终端输入以下指令(python3 环境,无依赖的第三方模块)

python -m Mooc
6.打包指令
  1. 首先确保已经安装 pyinstaller,若未安装,则用 pip 安装

    pip install pyinstaller
    
  2. 然后再项目工程的更目录下,输入:

    pyinstaller Mooc.spec
    
  3. 最后会在项目工程根目录下出现一个dist文件夹,该文件夹会出现一个Mooc-3.4.0.exe程序

Mooc Downloader相关推荐

  1. 解决中国大学MOOC遮挡字幕问题

    解决中国大学MOOC遮挡字幕问题 方案1 这里采用一个简单有效的方法,运用css3的opacity属性,设置 div 元素的不透明级别.找到 <div class="u-edu-h5p ...

  2. MOOC《Python网络爬虫和信息提取》(第11次)网络爬虫之框架(第4周)

    MOOC<Python网络爬虫和信息提取>(第11次)网络爬虫之框架(第4周) MOOC–Python网络爬虫和信息提取(第11次开课) 网络爬虫之框架 21.08.10 目录 文章目录 ...

  3. python爬取MOOC课程信息

    MOOC课程信息爬取 时间 :2019-10-12 一.任务与目标 网站地址 http://www.imooc.com/course/list/ 2. 采用scrapy爬虫框架 爬取信息包括:课程名称 ...

  4. python-scapy爬取mooc网保存在数据库中并下载图片

    爬取的步骤 - 确定url地址; - 获取页面信息;(urllib, requests); - 解析页面提取需要的数据: (正则表达式, bs4, xpath) - 保存到本地(csv, json, ...

  5. Scrapy爬虫框架的解析与实例(中国大学MOOC)

    Scrapy框架  Scrapy是一个为了爬取网站数据,提取结构性数据而编写的应用框架. 可以应用在包括数据挖掘,信息处理或存储历史数据等一系列的程序中.其最初是为了 页面抓取 (更确切来说, 网络抓 ...

  6. Python:Downloader Middlewares

    反反爬虫相关机制 Some websites implement certain measures to prevent bots from crawling them, with varying d ...

  7. python嵩天课堂笔记_[Python机器学习]强化学习笔记(嵩天礼欣老师mooc第三周)

    [Python机器学习]强化学习笔记(嵩天礼欣老师mooc第三周) [Python机器学习]强化学习笔记(嵩天礼欣老师mooc第三周) 目录 强化学习 定义 马尔科夫决策过程 基本元素 值函数 最优值 ...

  8. qt 多个模型如何显示在表格中_Qt MOOC系列教程 第五章第四节:QML中的C++模型

    我们已经多次讨论过如何创建自己的模型来表示QML中的数据,并且在上一节中我们看到了QStandardItemModel的基本示例.通常,出于性能和功能方面的原因,需要从一开始就要实现自己的模型.QAb ...

  9. 下列属于PHP的数据类型的是,中国大学MOOC: 下列不属于PHP数据类型的是( )。...

    中国大学MOOC: 下列不属于PHP数据类型的是( ). 答:double 中国大学MOOC: 下列哪个选项不是学生不敢或不愿表达自己的想法的原因? 答:说话的人太多了,学生没有机会表达自己的观点 以 ...

最新文章

  1. SD 模块的几个增强
  2. 我的MAXSCRIPT笔记
  3. 剑指Offer - 面试题45. 把数组排成最小的数(字符串排序)
  4. bi power 两个日期挑较早的日期_功率 BI 中的时间智能:利用时间
  5. MaxScale中间件部署数据库读写分离
  6. python 数组学习
  7. Oracle 条件语句/循环语句
  8. 算法比赛玩腻了?试试这个不一样的 Java 编程挑战赛!
  9. 卷积神经网络之OverFeat(2014)
  10. java 排序sort_Java排序方法sort的使用详解(转)
  11. 台架控制器-AVL_ISAC学习
  12. 递归删除符合条件的目录,文件, kotlin,java
  13. Python:利用多种方式解微分方程(以二阶微分系统零状态响应为例)
  14. 题目 1020: 猴子吃桃的问题
  15. Erlang JAM二三话
  16. 漏洞复现-Redis
  17. 使用python解决数独问题
  18. Vista下AD1980/AD198X声卡驱动
  19. 软考初级程序员上午单选题(17)
  20. 最牛支付工具问世,支付宝慌了?

热门文章

  1. The new features of OSX 10.11 and Xcode 7
  2. Win10:已禁用IME
  3. 小米平板刷android l,小米平板5即将杀到:骁龙870/天玑1200双芯片+11寸高刷大屏!...
  4. 在安卓手机上运行Linux系统——linuxdeploy的安装和使用
  5. gpio pad的latch功能
  6. 360 C++ 编程规范
  7. 深度:自动驾驶特斯拉背后核心技术解析
  8. 线上教育系统平台,企业如何才能运营呢?
  9. 招商银行掌上生活APP 7.0产品分析报告
  10. 建筑企业在进行数字化转型的过程中的捷径有哪些?