请至PC端网页下载本课程代码课件及数据。

文本挖掘(TM),又称自然语言处理(NLP),是AI时代炙手可热的数据分析挖掘前沿领域,其所涉及的人机对话系统,推荐算法,文本分类等技术在BAT等企业中都得到广泛应用。

本课程将使用经典武侠小说、大众点评抓取结果、微博语料数据等多个实际案例进行教学。

本次课程将会从基本的分词、词袋模型、分布式表示等概念开始,多面介绍文本挖掘技术的各个方面,特别会针对目前最热的word2vec,gensim 等结合实际案例进行学习,帮助学员直接升级至业界技术前沿。

学习完本课程后,学员将能够独立使用Python环境完成中文文本挖掘的各种工作。

本课程已全部更新完毕,未来将根据方法学的**进展做不定期更新。

【课程长度】

总时长:约11小时

【学员基础】

学员需要懂得Python语言的基本编程知识。

建议学员事先学习本系列课程中的Pandas课程,本课程中的数据管理将会用到Pandas的相关知识和操作。

【课程大纲】

第1章:文本挖掘概述

第2章:磨刀不误砍柴工

第3章:分词

第4章:词云展示

第5章:文档信息的向量化

第6章:关键词提取

第7章:抽取文本主题

第8章:文本相似度

第9章:文档分类

第10章:情感分析

第10章:自动摘要

第11章:自动写作

基于python文本挖掘实战_Python数据分析系列视频课程--学习文本挖掘相关推荐

  1. 复旦大学python教学视频_学习使用各种计时工具_Python数据分析系列视频课程--学习Pandas_数据挖掘与分析视频-51CTO学院...

    Pandas包是基于Python平台的数据管理利器,已经成为了Python进行数据分析和挖掘时的数据基础平台和事实上的工业标准,学习其使用方法,是使用Python进行数据分析和数据挖掘的必备条件. 本 ...

  2. python做数据可视化视频_Python数据分析系列视频课程--玩转数据可视化

    matplotlib包是基于Python平台的统计绘图利器,是在python平台上完成数据可视化不可或缺的工具,而基于matplotlib进一步开发的seaborn,更是将数据呈现与可视化的可用性推到 ...

  3. Python爬虫实战视频教程-李宁-专题视频课程

    Python爬虫实战视频教程-719人已学习 课程介绍         本课程使用Python3作为编程语言,主要内容包括Python爬虫的基本原理,编写简单的爬虫,使用爬虫从百度下载比基尼美女图片. ...

  4. 51cto python数据分析系列课程 55g_热图_ Python数据分析系列视频课程--玩转数据可视化_数据可视化视频-51CTO学院...

    matplotlib包是基于Python平台的统计绘图利器,是在python平台上完成数据可视化不可或缺的工具,而基于matplotlib进一步开发的seaborn,更是将数据呈现与可视化的可用性推到 ...

  5. 深入掌握大数据Kafka的使用(基于Python开发)-张明阳-专题视频课程

    深入掌握大数据Kafka的使用(基于Python开发)-3人已学习 课程介绍         深入掌握大数据Kafka实战视频教程,本课程为实战教学,主要介绍了Kafka的生产者.消费者,其中重点内容 ...

  6. python接口测试框架与自动化实战_Python接口自动化从设计到开发,测试框架实战与自动化进阶视频课程...

    Python接口自动化从设计到开发,测试框架实战与自动化进阶视频课程21套高级软件测试,性能测试,功能测试,自动化测试,接口测试,移动端测试,手机测试,WEB测试,渗透测试,测试用例设计,黑盒测试,白 ...

  7. 基于Python的直播平台数据分析可视化系统

    温馨提示:文末有 CSDN 平台官方提供的学长 Wechat / QQ 名片 :) 1. 项目简介 随着移动互联网和5G的快速发展,视频直播行业呈现出丰富多元的内容形态,覆盖更多的场景和受众,视频成为 ...

  8. 基于Python热点新闻关键词数据分析系统

    温馨提示:文末有 CSDN 平台官方提供的博主 Wechat / QQ 名片 :) 1. 项目简介 利用网络爬虫技术从某新闻网站爬取最新的新闻数据,并进行版块分类,对某篇版块下的所有新闻进行中文分词, ...

  9. 视频教程-快速入门Python基础教程_Python基础进阶视频-Python

    快速入门Python基础教程_Python基础进阶视频 十余年计算机技术领域从业经验,在中国电信.盛大游戏等多家五百强企业任职技术开发指导顾问,国内IT技术发展奠基人之一. 杨千锋 ¥199.00 立 ...

最新文章

  1. 一种定位内存泄露的方法(Linux)
  2. 软考经过 之 天助自助者
  3. bzoj 1705: [Usaco2007 Nov]Telephone Wire 架设电话线【dp】
  4. EasyUI中树的基本操作
  5. 《Cracking the Coding Interview》——第11章:排序和搜索——题目7
  6. SHA384-算法解密
  7. 查找最接近的元素c语言,查找最接近的元素
  8. python web开发中跨域问题的解决思路
  9. php的前端环境,PHP中的环境变量
  10. Kubernetes网络模型概念
  11. 【转】Android 关于arm64-v8a、armeabi-v7a、armeabi、x86下的so文件兼容问题
  12. Adobe Reader 8 简体中文版最新版本
  13. Java教务排课系统
  14. python画抛物线_在python中利用最小二乘拟合二次抛物线函数的方法
  15. 一致性哈希算法--数据库应用
  16. matlab模拟薄膜振动,(数理方程)Matlab模拟琴弦振动发声并显示振动图像
  17. 一份奇奇怪怪的地图设计书
  18. iframe标签中写html代码,Iframe嵌套HTML网页的用法?
  19. 九种查找算法-哈希查找
  20. 学习新概念第一册 第一堂课 音标和基础知识储备(1)

热门文章

  1. 计算机和电子音乐之间的关系,浅析计算机音乐中算法作曲的特点及与作曲技法的对应关系.doc...
  2. SOA的实施加速电信业务流程更新
  3. zzuli OJ 1006: 求等差数列的和
  4. 上海宝付总结的跨境支付知识点,请查收
  5. LTE attach 流程UE-eNodeB
  6. Scratch画雪花 电子学会图形化编程Scratch等级考试四级真题 2020-12
  7. Android面试-LaunchMode及Task工作模式(扔物线笔记)
  8. 不去做未来总会告诉你late
  9. Oracle数据库分页查询关键字rownum理解
  10. 开源 | 嵌入式物联网应用开发 - 无线收发模块