↑↑↑关注后"星标"Datawhale

每日干货 & 每月组队学习,不错过

Datawhale开源

贡献者:陈安东、金娟娟、杨佳达、老表

开源初心

当我入门数据分析时,用的是鼎鼎大名的《python for data analysis》,书中对技术操作讲解细致,但遗憾的是,对于数据分析的逻辑介绍就少了很多。我和很多学习者会觉得敲了一堆代码却并不知道有什么用。毕竟理论学习和生活中的实际运用有不小的鸿沟。如何抹平这个鸿沟,就需要自己的尝试以及学习实战的资料。

有没有这样一个开源教程,以项目为主线,知识点孕育其中,通过边学、边做、边引导来得到更好的学习效果? 调查了一圈,发现现有关于数据分析的项目好像没有可以完全符合这样标准的(失望.jpg)。

没有就自己来做!Datawhale的小伙伴一拍即合,来做一门自己想要的数据分析开源课程,期待让所有使用了这个教程的伙伴可以更好的开启自己的数据分析之路,既能掌握pandas等的知识点,又能掌握数据分析的大致思路和流程!

现在,这门课程已经更新到了1.3版本,优化了学习流程并有更好的答案讲解,后期还会逐步推出配套教材(特别感谢马老师的认可,推荐自己学生使用这个教材)。今后还是希望从基础的数据分析操作和数据分析流程讲起,在每个模块都引入实战的例子,并会不断加入新的内容(比如数据挖掘算法等)。这是个开源项目,会不断迭代,大家共同参与,一起努力。

关于项目的名字——动手学数据分析(Hands-on data analysis)。数据分析是从一堆数字中看到真相的过程。学会操作数据只是数据分析的一半功力,剩下的另一半要用我们的大脑,多多思考,多多总结,更要多动手,实打实的的敲代码。所以也希望在学习这门课时,多去推理,多去问问为什么;多多练习,确保理论实践结合起来,在课程结束的时候一定会有大收获。

开源地址:https://github.com/datawhalechina/hands-on-data-analysis

学习思路

教程内容

教程现分为三个单元,大致可以分为:数据基础操作,数据清洗与重构,建模和评估。

  1. 数据基础操作:我们将得到一个要分析的数据,要学习如何加载数据,查看数据,然后学习Pandas的一些基础操作,最后尝试探索性的数据分析。

  2. 数据清洗与重构:当我们可以比较熟练的操作数据并认识这个数据之后,我们需要将原始数据变为一个可用好用的数据,为之后放入模型做准备

  3. 建模和评估:我们根据任务需求不同,要考虑建立什么模型,我们将使用流行的sklearn库,建立模型。评估我们模型的好坏,对模型做优化。

通关方法

教程的代码都是jupyter形式,每部分教程都分为课程+答案两部分。学习期间,在课程代码中,完成所有的学习,自己查找资料,自己完成里面的代码操作,思考部分以及心得。之后可以和小伙伴讨论,分享资料和心得。关于答案部分,大家可以参考,但是由于数据分析本身是开放的,所以答案也是开放式的,更多希望大家可以有自己理解和答案。如果需要参考,答案部分提供了参考。

课程:按要求敲出自己的代码

参考答案

学习反馈

作为一个没基础的小白学习者,这期动手学数据分析我学得很舒服,教程也比较简单和清楚,整体学下来感觉是很流畅的。每个task我都会把教程看两遍。第一遍只看教程,按着教程思路顺下来,看完以后再啃利用Python进行数据分析这本书,边看边做笔记(顺便把csdn写了)作业的拓展性这里必须给我加分,然后第二遍看教程就是完全不看答案把作业和思考做完。基本上学完还是很有成就感的,而且真的有学到很多东西。这个课程作为一个数据分析的入门课程,真的巨赞!

——华北电力大学,吴丹飞

首先这个学习文档做得很好,很有引导性,也是我看下来项目中比较好的一种学习方式——主动学习,不懂就搜索、问。作为有Python数据分析基础的学员很有复习、提高、巩固的功能。项目相对来说没有那么的贴切生活。建模那一块我之前有接触过,但是我搞不懂就没什么可建议的了.

——李晴晴

帮助还不小,因为后面做项目感觉还在不断用这些技巧,非常有用。我觉得可以加点数据分析的分析思路过程。(作者:这是重点更新的部分)

‍‍‍——V1.0 版组队学习参与者

成为贡献者

如果你也想和我们一起成为数据分析开源教程的贡献者,无论是内容的补充完善,还是发现教程的错误,请毫不犹豫地去GitHub提Issues反馈!

记得说明提问内容属于哪一个部分,然后提交你希望补充内容或者勘误信息,我们通常会在24小时以内给您回复,超过24小时未回复的话可以邮件联系chenands@qq.com。

加入交流群

如果你想一起学习交流,或者希望参与贡献反馈,后台回复“210626可加入我们的交流群。

核心贡献者陈安东

Datawhale成员,中央民族大学 | Queen Marry University of London

贡献者金娟娟

Datawhale成员,浙江大学硕士

贡献者杨佳达

Datawhale成员,数据挖掘工程师

贡献者老表

Datawhale成员,公号简说Python

教程开源学习贡献者

红空星:组织成员,数据分析师

李空玲:组织成员,算法工程师

高立业:组织成员,太原理工硕士

张文涛:组织成员,中山大学博士

↓↓教程开源地址

Datawhale数据分析教程来了!相关推荐

  1. DataWhale数据分析组队学习——Day2

    DataWhale数据分析组队学习--Day2 引言 读取数据 数据预处理 总结 引言 今天是第二天,花了很多时间去搜索网页爬虫的资料,具体有几种方法,要考虑到从不同的网页抓取有不同的方法,一般用的方 ...

  2. SQL简明数据分析教程

    SQL与MySQL简介 数据库基础 从SQL的角度来看,数据库就是一个以某种有组织的方式存储的数据集合.我们可以采用数据库对数据进行有效的存储与管理,并运用数据库进行合理的处理与分析,使其转化为有价值 ...

  3. 2021最新spass数据分析教程 论文spass数据分析教程 数据分析怎么做spass教程

    在问卷调研中,SPSS分析被应用于统计分析的过程,能使研究者以客观的态度,通过对受众的系统提问,收集并分析有关研究数据,以描述.解释或预测问卷调查内容的现象及其各相关因素之间的关系. 2021最新sp ...

  4. Datawhale数据分析课程第二章

    Datawhale数据分析课程第二章 准备工作 数据清洗及特征处理 相关定义 缺失值观察与处理 任务一:缺失值观察 (1) 请查看每个特征缺失值个数 (2) 请查看Age, Cabin, Embark ...

  5. python炒股教程_Python股市数据分析教程 学会它,或可以实现半“智能”炒股

    原标题:Python股市数据分析教程 学会它,或可以实现半"智能"炒股 译者 | 阿里云云栖社区 摘要: 在本篇文章中,我们讨论了均线交叉策略的设计.回溯检验.基准测试以及实践中可 ...

  6. Haskell的数据分析教程 | Lynda教程 中文字幕

    Haskell的数据分析教程 | Lynda教程 中文字幕 Learning Haskell for Data Analysis 课程ID: 604234 时长: 3.3小时 所属类别:Haskell ...

  7. Seurat 单细胞转录组测序数据分析教程(二)——python(scanpy)

    Seurat 单细胞转录组测序数据分析教程(二)--python(scanpy) 文章参考至scanpy官网,做了一个更详细的解读. 数据由来自健康捐赠者的 3k PBMC组成,可从 10x Geno ...

  8. eplise怎么连接数据库_基于手机信令的大数据分析教程(一)数据导入数据库

    前言 该套教程以一个初学大数据的菜鸟视角,编写数据分析处理的整套流程.写得较为详(luo)细(suo),希望适用于任何城乡规划大数据的初学者.持续更新中,若有错误,望指正! 1.任务总纲 (1)职住数 ...

  9. python 数据分析教程推荐_太香了!墙裂推荐6个Python数据分析神器!!

    作者:东哥起飞,数据爱好者 Python数据科学 hello,大家好我是东哥! 用Python处理数据大家都不陌生了,属常规操作,但常规之下还是也有些暗藏技巧的,本篇东哥分享6个好玩高效的操作,帮助大 ...

最新文章

  1. angularJs在线API文档
  2. 数论 - SGU 105 DIV3
  3. php memcache扩展的一个细节
  4. MySQL 数据库常用命令小结
  5. 每天天一个linux命令echo,每天一个linux命令-echo(示例代码)
  6. 线程的状态 Thread.State||NEW,RUNNABLE,BLOCKED,WAITING,TIMED_WAITING,TERMINATED
  7. python bind_Python bind-允许同时按下多个键
  8. 查询MySQL字段注释的 5 种方法!
  9. mongodb for java_【MongoDB for Java】Java操作MongoDB
  10. 「SCOI2015」小凸想跑步 解题报告
  11. 以太坊 solidity 函数的完整声明格式
  12. Lesson 1#13 作业
  13. java lambda函数_Java中的Lambda函数
  14. 小组作业:学生信息管理系统需求分析
  15. 【JS】WPS宏编辑器
  16. Node.js学习笔记--进阶之路
  17. 这是一个转型AI的励志故事,从非科班到拿下竞赛一等奖
  18. 吴忌寒何以成“眼中钉”?
  19. 【三维目标检测】3DSSD(一)
  20. Qt对话框的事件循环分析(子线程中不能创建UI窗体分析2)

热门文章

  1. WebKit、Gecko使用图形库
  2. Tomcat手动配置简述【查询留存】
  3. Ext JS 4 笔记1
  4. 【青少年编程】【三级】换装
  5. 技术图文:03 结构型设计模式(上)
  6. LeetCode实战:存在重复元素
  7. C#语言与面向对象技术(2)
  8. TPAMI 2021 | 深度赋智AutoDL系列竞赛世界冠军方案首次公开
  9. 新转机!2020年想裸辞的程序员们注意了
  10. 10 个 Python 工程师,9 个不合格!