第2章 Python与数据分析
《Python数据分析基础教程》学习笔记。
第2章 Python与数据分析
2.1 Python数据分析常用的类库
类库是用来实现各种功能的类的集合。
-1. NumPy
NumPy(Numerical Python)是Python科学计算的基础包,提供以下功能:
- 快速高效的多维数组对象ndarrray是其核心。
- 用于对数组执行元素计算和直接对数组执行数学运算的函数。
- 用于读写硬盘上基于数组的数据集的工具。
- 线性代数运算、傅里叶变换,以及随机数生成。
- 用于将C、C++、Fortran代码集成到Python的工具。
- 作为算法之间传递数据的容器。
-2. pandas
pandas是Python数据分析的核心库,是基于NumPy构建的含有复杂数据结构和工具的数据分析包。
pandas围绕着Series(一维序列)和DataFrame(二维序列)着两个核心数据结构展开的。
pandas提供了复杂精细的索引功能,以便快捷地完成重塑、切片、聚合和选取数据子集等操作。
-3. Matplotlib
Matplotlib是最流行的用于绘制数据图表的Python库,非常适合创建出版物中的图表。
-4. SciPy
SciPy是一组专门用于科学计算的开源Python库,它构建于NumPy的基础之上,提供了一个用于在Python中进行科学计算的工具集。
SciPy经常于NumPy、pandas、Matplotlib和IPython这些核心库一起使用。
-5. scikit-learn
scikit-learn 是一个简单有效的数据挖掘和数据分析工具,可供用户在各种环境下重复使用。是建立在NumPy、SciPy和Matplotlib的基础上的,对一些常用的算法进行了封装。
scikit-learn 的基本功能主要为:
- 分类
- 回归
- 聚类
- 数据降维
- 模型选择
- 数据预处理
-6. IPython
IPython 是Python科学计算标准工具集的组成部分,它为交互式和探索式计算机提供了一个高效的开发环境。
2.2 Jupyter Notebook
Jupyter Notebook(又称 IPython Notebook)是一个交互式的在线编辑器,它可以每编辑一行代码就运行该行代码,并且将运行的结果显示在代码的下方。
Jupyter Notebook本质上是一个支持实时代码、数学方程式、可视化和Markdown的Web应用程序。它的用途:
- 数据清理和转换
- 数值模拟
- 统计建模
- 数据可视化
- 机器学习
第2章 Python与数据分析相关推荐
- Python+Excel数据分析实战:军事体能考核成绩评定(四)女子曲臂悬垂计算
上一章Python+Excel数据分析实战:军事体能考核成绩评定(三)男子引体向上计算成功实现了男子引体向上计算的功能,这一章我们实现女子单杠考试成绩的计算,女子的单杠考核与男子的引体向上不同,为曲臂 ...
- 《利用Python进行数据分析·第2版》第6章 数据加载、存储与文件格式
第1章 准备工作 第2章 Python语法基础,IPython和Jupyter 第3章 Python的数据结构.函数和文件 第4章 NumPy基础:数组和矢量计算 第5章 pandas入门 第6章 数 ...
- 利用python进行数据分析——第十四章_数据分析案例
文章目录 本章中的数据文件可从下面的github仓库中下载 利用python进行数据分析(第二版) 一.从Bitli获取 1.USA.gov数据 1.1纯python时区计数 1.2使用pandas进 ...
- 利用python进行数据分析——第13章 python建模库介绍
文章目录 一.pandas与建模代码的结合 二.使用patsy创建模型描述 2.1Patsy公式中的数据转换 2.2分类数据与Patsy 三.statsmodels介绍 3.1评估线性模型 3.2评估 ...
- 用python进行数据分析——第十二章.高阶pandas
文章目录 文章推荐: 数据可视化--利用pandas和seaborn绘图基础 利用python进行数据分析--第十章.GroupBy机制(数据聚合与分组操作) 利用python进行数据分析--第十一章 ...
- 《利用Python进行数据分析·第2版》第13章 Python建模库介绍
第1章 准备工作 第2章 Python语法基础,IPython和Jupyter 第3章 Python的数据结构.函数和文件 第4章 NumPy基础:数组和矢量计算 第5章 pandas入门 第6章 数 ...
- 数据基础---《利用Python进行数据分析·第2版》第8章 数据规整:聚合、合并和重塑
之前自己对于numpy和pandas是要用的时候东学一点西一点,直到看到<利用Python进行数据分析·第2版>,觉得只看这一篇就够了.非常感谢原博主的翻译和分享. 在许多应用中,数据可能 ...
- 数据基础---《利用Python进行数据分析·第2版》第12章 pandas高级应用
之前自己对于numpy和pandas是要用的时候东学一点西一点,直到看到<利用Python进行数据分析·第2版>,觉得只看这一篇就够了.非常感谢原博主的翻译和分享. 前面的章节关注于不同类 ...
- 数据基础---《利用Python进行数据分析·第2版》第11章 时间序列
之前自己对于numpy和pandas是要用的时候东学一点西一点,直到看到<利用Python进行数据分析·第2版>,觉得只看这一篇就够了.非常感谢原博主的翻译和分享. 时间序列(time s ...
最新文章
- 今年2月的微盟“删库”主角被判 6 年有期徒刑
- MySQL的MyISAM和InnoDB存储引擎表结构
- SAP Spartacus login 页面看不到 UI 控件的问题解决
- ArrayList、HashMap、HashSet是线程不安全的,高并发下如何解决?
- 【作品】超级玛丽射击版
- 调优哪家强——tensorflow命令行参数
- java线程释放_Java多线程出现异常会自动释放锁
- Learning to Ranking
- 动易BizIdea后台添加自定义功能
- redhat 5.4 搭建本地YUM源
- 【PLSQL】PLSQL安装、破解以及汉化教程
- 只需 1 分钟,这个网站用 AI 分离歌曲的人声、伴奏和乐器声
- 逆向脱壳附加数据处理
- 多种文件上传绕过手法
- 百度SiteApp网站打不开,手机站可以这样搞掂
- python求直角三角形个数的公式_Python3 欧拉计划 问题71-75
- 位(bit)、字节(Byte)、MB(兆位)之间的换算关系
- BIT软件工程个人项目——数独sudoku
- android手机用户,2011年Android手机用户使用行为研究报告
- 基于nodejs的二手物物交换平台【毕业设计源码】
热门文章
- 在.NET中使用DiagnosticSource
- Dotnet Core IHttpClientFactory深度研究
- 从编码层面对比java和c#
- 未雨绸缪 | 一文简介 Azure Front Door
- eShopOnContainers 看微服务④:Catalog Service
- 微软西雅图总部DevOps交流总结
- 老衣的微服务实践简要指引2017版
- 为什么转换到Visual Studio 2017如此 “容易”
- c语言不规则窗口,C语言不规则数组和指针
- [转]浅析DDD(领域驱动设计)