1.公开的数据集

做数据分析和数据挖掘,最基础的就是数据集了,这里分享一些科研机构、企业、政府会开放的一些数据集。这些数据集通常比较完善、质量相对较高。给大家推荐一些常用的可以获取数据集的网站:

UCI:加州大学欧文分校开放的经典数据集,真的很经典,被很多机器学习实验室采用。

Awesome Public Datasets:这是github一大神整理的一个丰富的数据集资源获取渠道合集。

国家数据:数据来源于中国国家统计局,包含了我国经济民生等多个方面的数据。

CEIC:超过128个国家的经济数据,能够精确查找GDP, CPI, 进口,出口,外资直接投资,零售,销售,以及国际利率等深度数据。

中国统计信息网:国家统计局的官方网站,汇集了海量的全国各级政府各年度的国民经济和社会发展统计信息。

几个政务数据开放做的比较好的地区:上海市政务数据服务网、北京市政务数据资源网、广州市政府数据统一开放平台、贵州省政府数据开放平台

其他可以参考:有哪些一般人不知道的数据获取方式

2.博客资源

CSDN大数据:各种干货博客每日更新,经常会有惊喜。

开源中国大数据:数据方向各种干货博客。

爱可可-爱生活:数据挖掘领域知名微博,优质机器学习资源分享,由北邮的老师创建。

刘未鹏 | Mind Hacks:刘未鹏的博客,虽然更新很慢,但文章都很深刻。

我爱机器学习:超多机器学习干货,质量都非常高。

3.知乎专栏

一个数据分析师的自我修养:分享数据分析经验和看法为主,时不时扯点关于游戏的事。

数据冰山:各种业务数据分析,经常聊到汽车。

数据分析侠:专注数据分析,很多技术干货。

董老师在硅谷:董老师的专栏,分享技术与职业发展。

智能单元:关于人工智能和深度学习,还有cs231n的笔记。

无痛的机器学习:介绍机器学习的算法原理与应用。

混沌巡洋舰:包含数据科学的诸多领域知识。

4.免费学习网站

菜鸟教程:各种编程语言、数据库等学习资源,知识梳理非常清晰。

DataCamp:Python、R、数据分析、数据挖掘学习。

edx-数据科学:edx的所有数据科学方向的课程。

Data Science Courses | Coursera:Coursera上所有的数据科学课程。

全部课程 | MOOC学院:MOOC学院所有数据科学课程。

硬创公开课:雷锋网推出的人工智能方向的公开课。

5.行业网站

Analytics Vidhya:超多实用的数据分析、数据挖掘干货文章,也包含行业资讯。

36大数据:大数据方向行业资讯,也有一些干货的文章。

数据分析网:大数据行业资讯。

数据科学:大数据资讯、观点、数据分析技术研习中心。

雷锋网:雷锋网之前做科技媒体,现在转型数据科学和人工智能方向,做的也不错。

199IT大数据导航:比较全的大数据相关网站导航,应有尽有。

数据分析网导航:数据分析网推出的大数据方向网站的导航。

6.数据科学竞赛

DataCastle:国内专业的数据挖掘竞赛平台,由周涛教授发起。

Kaggle:国外覆盖人数最多的数据科学竞赛平台。

天池:阿里旗下数据竞赛平台。

7.学术论文

Best paper awards:包含AAAI KDD IJCAI CVPR等十多个顶级会议从1996年以来的所有顶级论文,做数据科学研究的顶级资源。

arXiv.org:强大的论文库,可以寻找你需要的德众论文资源。

SIGKDD:数据挖掘领域的顶级会议,KDD每年的论文和KDD CUP都有很多可学习的东西。

Google学术:站在巨人的肩上,不解释。

这么多数据资源还不够用怎么办,学会爬虫自己爬取想要的数据,推荐一门课程:爬虫(入门+进阶),想爬就爬,数据应有尽有。

网站|数据分析、大数据、数据挖掘或者数据分析学习相关的网站相关推荐

  1. R语言与数据分析(1) 数据分析流程、数据挖掘、数据可视化

    R软件 R是免费的 R是一个全面的统计研究平台,提供了各式各样的数据分析技术 R拥有顶尖的绘图功能 数据分析 什么是数据 数据是对客观事件进行记录并可以鉴别的符号,是对客观事物的性质.状态以及相互关系 ...

  2. 非常值得收藏的书签栏,程序员学习与设计相关的网站(有附件下载)

    以下网站是我自己收藏学习与设计相关的网站,从程序员大佬手中扒来的,也有自己的这个是我在CSDN上写的第二篇文章,我也不知道写啥,冥思苦想了好长时间,突然想起来我创建这个博客的目的是分享学习和生活的日常 ...

  3. 视频教程-数据挖掘基础:零基础学Python数据分析-大数据

    数据挖掘基础:零基础学Python数据分析 辽宁师范大学教师,特聘教授,硕士生导师.大数据与商务智能实验室主任. 李洪磊 ¥198.00 立即订阅 扫码下载「CSDN程序员学院APP」,1000+技术 ...

  4. 【爬虫+数据可视化毕业设计:英雄联盟数据爬取及可视化分析,python爬虫可视化/数据分析/大数据/大数据屏/数据挖掘/数据爬取,程序开发-哔哩哔哩】

    [爬虫+数据可视化毕业设计:英雄联盟数据爬取及可视化分析,python爬虫可视化/数据分析/大数据/大数据屏/数据挖掘/数据爬取,程序开发-哔哩哔哩] https://b23.tv/TIoy6hj

  5. 大数据教程(14.1)网站数据分析(一)

    2019独角兽企业重金招聘Python工程师标准>>> 前面一章,介绍了大数据hadoop生态圈中组件Flume.azkaban.sqoop的相关知识,截止目前,大数据离线分析的技术 ...

  6. 【【数据可视化毕业设计:差旅数据可视化分析,python爬虫可视化/数据分析/大数据/大数据屏/数据挖掘/数据爬取,程序开发-哔哩哔哩】-哔哩哔哩】 https://b23.tv/iTt30QG

    [[数据可视化毕业设计:差旅数据可视化分析,python爬虫可视化/数据分析/大数据/大数据屏/数据挖掘/数据爬取,程序开发-哔哩哔哩]-哔哩哔哩] https://b23.tv/iTt30QG ht ...

  7. 数据分析的工作内容是什么,数据分析师、数据产品经理和数据挖掘工程师三个岗位之间,有什么联系和区别?

    数据分析工作内容: a.临时取数分析,比如双11大促活动分析:产品的流量转化情况.产品流程优化分析,等等: b.报表需求分析–比如企业常见的日报.周报.月报.季报.年报.产品报表.流量转化报表.经营分 ...

  8. 数据挖掘,你知道的大公司有哪些?独家揭秘:大数据公司挖掘数据价值的49个典型案例

    对于企业来说,100条理论确实不如一个成功的标杆有实践意义,本文的主旨就是寻找"正在做"大数据的49个样本. 本文力图从企业运营和管理的角度,梳理出发掘大数据价值的一般规律:一是以 ...

  9. 【工业大数据】 昆仑数据首席科学家田春华:人工智能降低了工业大数据分析的门槛

    机器之心原创 作者:高静宜 在刚刚结束的国际 PHM 数据竞赛中,昆仑数据的 K2 代表队以绝对优势一举夺冠,成为 PHM Data Challenge 十年竞赛史上首个完全由中国本土成员组成的冠军团 ...

最新文章

  1. python科学计算笔记(十三)pandas的merge、concat合并数据集
  2. salesforce lightning零基础学习(三) 表达式的!(绑定表达式)与 #(非绑定表达式)
  3. pythonopencv提取圆内图像_python – 使用OpenCV从图像中提取多边形给定...
  4. php导入json文件_[php]导入超大json文件
  5. myEclipse的subversion插件Subclipse
  6. python和c 的区别-c 跟 python的区别有哪些
  7. 点4下还是点1下?使用jQuery启动一个SharePoint工作流
  8. typescript之hasOwnProperty
  9. 论文阅读笔记(十)——Acoustic Scene Classification Using Reduced MobileNet Architecture
  10. 七、JVM类加载机制
  11. 再也不学AJAX了!(三)跨域获取资源 ② - JSONP CORS
  12. Matlab批量读取csv、txt、prn等文件
  13. Matlab无法打开
  14. 项目:妍妍的相册1——设计
  15. 使用Git上传项目到Gitgub
  16. Spring核心方法 refresh 解析
  17. 运筹学笔记 线性规划与单纯形法
  18. 笔记十一:提升高效技术领导的创新能力
  19. 2022 年排名前 10 的聊天机器人[示例]
  20. Spring框架汇总(大学生的天堂 码农的圣殿)

热门文章

  1. String的底层结构(使用频率较高的)(java.lang.invoke.MethodHandleImpl.MAX_ARITY)
  2. 北方民族大学计算机复试题库,2016年北方民族大学计算机科学与工程学院信号与系统复试笔试仿真模拟题...
  3. 学校计算机操作培训方案,学校信息化培训方案.doc
  4. 弘辽科技:淘宝劳动节活动什么时候开始呢?商家要准备什么呢?
  5. es6语法 箭头函数
  6. cygwin 安装 swoole
  7. Mac新手必看教程—轻松玩转Mac OS
  8. 100个口腔正畸测试题及答案
  9. 电小天线理论仿真-单极子天线1
  10. (数字ic)CDC设计实例 - ICG :integrate Clock Gating Cell