《Python数据分析基础教程》学习笔记。

第2章 Python与数据分析

2.1 Python数据分析常用的类库
类库是用来实现各种功能的类的集合。

-1. NumPy
NumPy(Numerical Python)是Python科学计算的基础包,提供以下功能:

  • 快速高效的多维数组对象ndarrray是其核心。
  • 用于对数组执行元素计算和直接对数组执行数学运算的函数。
  • 用于读写硬盘上基于数组的数据集的工具。
  • 线性代数运算、傅里叶变换,以及随机数生成。
  • 用于将C、C++、Fortran代码集成到Python的工具。
  • 作为算法之间传递数据的容器。

-2. pandas
pandas是Python数据分析的核心库,是基于NumPy构建的含有复杂数据结构和工具的数据分析包。
pandas围绕着Series(一维序列)和DataFrame(二维序列)着两个核心数据结构展开的。
pandas提供了复杂精细的索引功能,以便快捷地完成重塑、切片、聚合和选取数据子集等操作。

-3. Matplotlib
Matplotlib是最流行的用于绘制数据图表的Python库,非常适合创建出版物中的图表。

-4. SciPy
SciPy是一组专门用于科学计算的开源Python库,它构建于NumPy的基础之上,提供了一个用于在Python中进行科学计算的工具集。
SciPy经常于NumPy、pandas、Matplotlib和IPython这些核心库一起使用。

-5. scikit-learn
scikit-learn 是一个简单有效的数据挖掘和数据分析工具,可供用户在各种环境下重复使用。是建立在NumPy、SciPy和Matplotlib的基础上的,对一些常用的算法进行了封装。
scikit-learn 的基本功能主要为:

  • 分类
  • 回归
  • 聚类
  • 数据降维
  • 模型选择
  • 数据预处理

-6. IPython
IPython 是Python科学计算标准工具集的组成部分,它为交互式和探索式计算机提供了一个高效的开发环境。

2.2 Jupyter Notebook
Jupyter Notebook(又称 IPython Notebook)是一个交互式的在线编辑器,它可以每编辑一行代码就运行该行代码,并且将运行的结果显示在代码的下方。
Jupyter Notebook本质上是一个支持实时代码、数学方程式、可视化和Markdown的Web应用程序。它的用途:

  • 数据清理和转换
  • 数值模拟
  • 统计建模
  • 数据可视化
  • 机器学习

第2章 Python与数据分析相关推荐

  1. Python+Excel数据分析实战:军事体能考核成绩评定(四)女子曲臂悬垂计算

    上一章Python+Excel数据分析实战:军事体能考核成绩评定(三)男子引体向上计算成功实现了男子引体向上计算的功能,这一章我们实现女子单杠考试成绩的计算,女子的单杠考核与男子的引体向上不同,为曲臂 ...

  2. 《利用Python进行数据分析·第2版》第6章 数据加载、存储与文件格式

    第1章 准备工作 第2章 Python语法基础,IPython和Jupyter 第3章 Python的数据结构.函数和文件 第4章 NumPy基础:数组和矢量计算 第5章 pandas入门 第6章 数 ...

  3. 利用python进行数据分析——第十四章_数据分析案例

    文章目录 本章中的数据文件可从下面的github仓库中下载 利用python进行数据分析(第二版) 一.从Bitli获取 1.USA.gov数据 1.1纯python时区计数 1.2使用pandas进 ...

  4. 利用python进行数据分析——第13章 python建模库介绍

    文章目录 一.pandas与建模代码的结合 二.使用patsy创建模型描述 2.1Patsy公式中的数据转换 2.2分类数据与Patsy 三.statsmodels介绍 3.1评估线性模型 3.2评估 ...

  5. 用python进行数据分析——第十二章.高阶pandas

    文章目录 文章推荐: 数据可视化--利用pandas和seaborn绘图基础 利用python进行数据分析--第十章.GroupBy机制(数据聚合与分组操作) 利用python进行数据分析--第十一章 ...

  6. 《利用Python进行数据分析·第2版》第13章 Python建模库介绍

    第1章 准备工作 第2章 Python语法基础,IPython和Jupyter 第3章 Python的数据结构.函数和文件 第4章 NumPy基础:数组和矢量计算 第5章 pandas入门 第6章 数 ...

  7. 数据基础---《利用Python进行数据分析·第2版》第8章 数据规整:聚合、合并和重塑

    之前自己对于numpy和pandas是要用的时候东学一点西一点,直到看到<利用Python进行数据分析·第2版>,觉得只看这一篇就够了.非常感谢原博主的翻译和分享. 在许多应用中,数据可能 ...

  8. 数据基础---《利用Python进行数据分析·第2版》第12章 pandas高级应用

    之前自己对于numpy和pandas是要用的时候东学一点西一点,直到看到<利用Python进行数据分析·第2版>,觉得只看这一篇就够了.非常感谢原博主的翻译和分享. 前面的章节关注于不同类 ...

  9. 数据基础---《利用Python进行数据分析·第2版》第11章 时间序列

    之前自己对于numpy和pandas是要用的时候东学一点西一点,直到看到<利用Python进行数据分析·第2版>,觉得只看这一篇就够了.非常感谢原博主的翻译和分享. 时间序列(time s ...

最新文章

  1. 今年2月的微盟“删库”主角被判 6 年有期徒刑
  2. MySQL的MyISAM和InnoDB存储引擎表结构
  3. SAP Spartacus login 页面看不到 UI 控件的问题解决
  4. ArrayList、HashMap、HashSet是线程不安全的,高并发下如何解决?
  5. 【作品】超级玛丽射击版
  6. 调优哪家强——tensorflow命令行参数
  7. java线程释放_Java多线程出现异常会自动释放锁
  8. Learning to Ranking
  9. 动易BizIdea后台添加自定义功能
  10. redhat 5.4 搭建本地YUM源
  11. 【PLSQL】PLSQL安装、破解以及汉化教程
  12. 只需 1 分钟,这个网站用 AI 分离歌曲的人声、伴奏和乐器声
  13. 逆向脱壳附加数据处理
  14. 多种文件上传绕过手法
  15. 百度SiteApp网站打不开,手机站可以这样搞掂
  16. python求直角三角形个数的公式_Python3 欧拉计划 问题71-75
  17. 位(bit)、字节(Byte)、MB(兆位)之间的换算关系
  18. BIT软件工程个人项目——数独sudoku
  19. android手机用户,2011年Android手机用户使用行为研究报告
  20. 基于nodejs的二手物物交换平台【毕业设计源码】

热门文章

  1. 在.NET中使用DiagnosticSource
  2. Dotnet Core IHttpClientFactory深度研究
  3. 从编码层面对比java和c#
  4. 未雨绸缪 | 一文简介 Azure Front Door
  5. eShopOnContainers 看微服务④:Catalog Service
  6. 微软西雅图总部DevOps交流总结
  7. 老衣的微服务实践简要指引2017版
  8. 为什么转换到Visual Studio 2017如此 “容易”
  9. c语言不规则窗口,C语言不规则数组和指针
  10. [转]浅析DDD(领域驱动设计)