【机器学习】Pandas入门
目录
一、基本概述
二、重要的两个数据结构
三、创建方法
四、参数解析
五、读取文件的方法
六、查看df属性的操作
七、基本操作
八、缺失值处理
一、基本概述
Pandas 库是一个免费、开源的第三方 Python 库,是 Python 数据分析必不可少的工具之一,它为 Python 数据分析提供了高性能,且易于使用的数据结构,即 Series 和 DataFrame。
二、重要的两个数据结构
Series:是一种一维的结构,类似于一维列表和ndarray中的一维数组,但是功能比他们要更为强大,Series由两部分组成:索引index和数值values;
DataFrame:DataFrame 是一个表格型的数据结构,它含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔类型)。
三、创建方法
1.创建方法如下:
import pandas as pd
import numpy as np
a = np.array(['a','b','c','d'])
s = pd.Series(a)
print (s)
第一列为标签,第二列为数据,一一对应。dtype为数据类型。
2.创建DataFrame方法如下:
import pandas as pddata = [['li',18],['wang',12],['sun',13]]df = pd.DataFrame(data,columns=['name','Age'],dtype=float)print(df)
第一列:为index(0,1,2),第一行:列标签columns,左下角:data。
四、参数解析
pandas.DataFrame( data, index, columns, dtype, copy)
参数 | 说明 |
data |
一组数据(ndarray、series, map, lists, dict 等类型)。 |
index |
索引值,或者可以称为行标签。 |
columns |
列标签,默认为(0, 1, 2, …, n) 。 |
dtype | 数据类型。 |
copy | 拷贝数据,默认为 False。 |
五、读取文件的方法
读取文件这块比较简单,只要掌握read_csv等函数即可,如下图代码所示:
import pandas as pd
if __name__ == '__main__':#1.加载数据df = pd.read_csv(r"D:\企业课\data\1.csv")print(df)#输出df所有内容
数据文件1.csv陆续会上传,方便大家使用!
六、查看df属性的操作
属性 | 描述 |
shape | df的类型 |
index | 索引值 |
columns | 列标签 |
ndim | 查看维度 |
info() | 查看函数的帮助文档,方便使用 |
import pandas as pd
if __name__ == '__main__':#1.加载数据df = pd.read_csv(r"D:\企业课\data\1.csv")#查看df 属性print(df.shape)print("--" * 20)print(df.index)print("--" * 20)print(df.columns)print("--" * 20)print(df.ndim)print("--" * 20)print(df.info())
七、基本操作
方法 | 描述 |
sum() | 求和 |
mean() | 求平均值 |
std() | 求标准差 |
describe() | 数据汇总描述 |
八、缺失值处理
1.检查缺失值,使用isnull()方法进行检查
2.缺失值计算,将缺失值NAN值视为0
3.清理并填充缺失值,使用fillna()函数将非空数据填充NAN值。
4.使用dropna()函数进行删除缺失值
本文将拿第4点进行举例
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.randn(5, 3), index=['a', 'c', 'e', 'f','h'],columns=['one', 'two', 'three'])
df = df.reindex(['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h'])
print(df)
#删除缺失值
print (df.dropna())
【机器学习】Pandas入门相关推荐
- python使用教程pandas-Python 数据处理库 pandas 入门教程基本操作
pandas是一个Python语言的软件包,在我们使用Python语言进行机器学习编程的时候,这是一个非常常用的基础编程库.本文是对它的一个入门教程. pandas提供了快速,灵活和富有表现力的数据结 ...
- AI基础:机器学习简易入门
0.导语 Machine Learning(机器学习)是研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能.它是人工智能的核心,是使计算机具有智 ...
- python《pandas入门》实现Excel数据字段的拆分
** python<pandas入门>实现Excel数据字段的拆分 ,简单说一下自己为什么写博客,主要原因如下: 1,先简单介绍下自己,我是药学本科毕业,工作几年了.在这几年里做过药物相关 ...
- 机器学习简易入门-附推荐学习资料
目录 (1)机器学习正规学习路线 (2)机器学习快速入门 (3)总结 感谢黄海广博士的分享 原创: 机器学习初学者 机器学习初学者 今天 机器学习如何入门?目前没有明确的答案.本站面向广大初学者,推荐 ...
- 机器学习从入门到创业手记-应用与实践
结束了sklearn的培训的同时也迎来了阶段考核,经过这段时间的学习除了发我对机器学习有所入门,另外也发现了高维已经天天和刘思聪出双入对了,但两个人均矢口否认两人的关系,由于刘思聪坐我旁边,我也时常听 ...
- python机器学习快速入门
机器学习快速入门 这是机器学习小白在csdn更新的第一篇文,课程学习资料来源于黑马程序员的3天快速入门python机器学习课程.由于本小白在学完特征工程后转去看吴恩达在coursera的机器学习课程 ...
- 深度学习-机器学习从入门到深入全套资源分享
深度学习.机器学习从入门到深入,全套资源分享.涉及深度学习.机器学习数学.算法基础理论.实战和工程开发相关最佳资源.深度学习常用模型相关教程,深度学习模型优化.调参相关技巧:深度学习常用的框架,公开数 ...
- 【直播】耿远昊:Pandas入门讲解(安泰第四届数据科学训练营)
Pandas入门讲解 直播信息 主讲人:耿远昊,Datawhale成员,joyful-pandas作者. 直播时间:2021年04月07日 20:00~21:00 直播内容: 时间序列中的必知必会: ...
- python花萼长度表_Python 数据分析答疑 5:Pandas入门
8.23 第五课 Pandas入门作业 1: 使用如下代码创建 DataFrame, gdp = {"country":["United States", &q ...
- python使用教程pandas-十分钟搞定pandas(入门教程)
本文是对pandas官方网站上<10Minutes to pandas>的一个简单的翻译,原文在这里.这篇文章是对pandas的一个简单的介绍,详细的介绍请参考:Cookbook .习惯上 ...
最新文章
- java对象转json字符串日期格式_fastJSON字符串类型数据中的日期转换为Java bean的日期对象...
- cmakelist 寻找opencv
- 25接口之间的单继承
- Centos下MySql用户管理
- ETL的数据同步工具调研(持续更新中)
- 【蜕变之路】第29天 CAST和CONVERT的区别(2019年3月19日)
- linux nginx安装
- 一个我自己建的程序员资料分享站
- 【转】粒子滤波简介以及相关技术探讨
- Unix/Linux环境C编程入门教程(20) 搭建基于Mac的 Xcode 与 QT 开发环境
- 复盘2020:那些崛起的公司
- 集合查询和查询结果处理
- 再来学习一下RT-Thread的软件架构 | 文末赠书5本《软件架构实践》
- 你听说过史莱姆吗??【oj】
- SpringMVC 上传文件或图片并以二进制流的方式存到数据库
- 《密码安全新技术》课程总结报告
- 福州大学计算机考研-一位二战考生的点点滴滴(连载1/5)
- 20155305乔磊2016-2017-2《Java程序设计》第三周学习总结
- 找男朋友软件测试大乐,抖音2020男朋友测试题答题
- 怎样在VI编辑器中使用鼠标移动光标(鼠标点哪里,光标移动到哪里)
热门文章
- QQ互联与财付通将打通登录态,移动支付更便捷
- springboot知识一
- utgard连接opcserver报错Caused by: org.jinterop.dcom.common.JIRuntimeException: Access is denied. [0x800
- RKMPP API安装使用总结
- java dtu 采集程序_DTU脚本编程_本地采集脚本指令详解
- 推荐系统(四)Field-aware Factorization Machines(FFM)
- WIN10 系统下下载安装YOLOV4并使用GPU加速(保姆级)
- win7桌面的计算机在哪里,win7更改桌面路径,win7桌面文件在哪里
- CentOS 8 已经不再支持,Rocky Linux 才是未来
- Android 颜色渐变 属性动画