目录

一、基本概述

二、重要的两个数据结构

三、创建方法

四、参数解析

五、读取文件的方法

六、查看df属性的操作

七、基本操作

八、缺失值处理

一、基本概述

Pandas 库是一个免费、开源的第三方 Python 库,是 Python 数据分析必不可少的工具之一,它为 Python 数据分析提供了高性能,且易于使用的数据结构,即 Series 和 DataFrame。

二、重要的两个数据结构

Series:是一种一维的结构,类似于一维列表和ndarray中的一维数组,但是功能比他们要更为强大,Series由两部分组成:索引index和数值values;

DataFrame:DataFrame 是一个表格型的数据结构,它含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔类型)。

三、创建方法

1.创建方法如下:

import pandas as pd
import numpy as np
a = np.array(['a','b','c','d'])
s = pd.Series(a)
print (s)

第一列为标签,第二列为数据,一一对应。dtype为数据类型。

2.创建DataFrame方法如下:

import pandas as pddata = [['li',18],['wang',12],['sun',13]]df = pd.DataFrame(data,columns=['name','Age'],dtype=float)print(df)

第一列:为index(0,1,2),第一行:列标签columns,左下角:data。

四、参数解析

pandas.DataFrame( data, index, columns, dtype, copy)

参数 说明

data

一组数据(ndarray、series, map, lists, dict 等类型)。

index

索引值,或者可以称为行标签。

columns

列标签,默认为(0, 1, 2, …, n) 。
dtype 数据类型。
copy 拷贝数据,默认为 False。

五、读取文件的方法

读取文件这块比较简单,只要掌握read_csv等函数即可,如下图代码所示:

import pandas as pd
if __name__ == '__main__':#1.加载数据df = pd.read_csv(r"D:\企业课\data\1.csv")print(df)#输出df所有内容

数据文件1.csv陆续会上传,方便大家使用!

六、查看df属性的操作

属性 描述
shape df的类型
index 索引值
columns 列标签
ndim 查看维度
info() 查看函数的帮助文档,方便使用
import pandas as pd
if __name__ == '__main__':#1.加载数据df = pd.read_csv(r"D:\企业课\data\1.csv")#查看df 属性print(df.shape)print("--" * 20)print(df.index)print("--" * 20)print(df.columns)print("--" * 20)print(df.ndim)print("--" * 20)print(df.info())

七、基本操作

方法 描述
sum() 求和
mean() 求平均值
std() 求标准差
describe() 数据汇总描述

八、缺失值处理

1.检查缺失值,使用isnull()方法进行检查

2.缺失值计算,将缺失值NAN值视为0

3.清理并填充缺失值,使用fillna()函数将非空数据填充NAN值。

4.使用dropna()函数进行删除缺失值

本文将拿第4点进行举例

import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.randn(5, 3), index=['a', 'c', 'e', 'f','h'],columns=['one', 'two', 'three'])
df = df.reindex(['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h'])
print(df)
#删除缺失值
print (df.dropna())

【机器学习】Pandas入门相关推荐

  1. python使用教程pandas-Python 数据处理库 pandas 入门教程基本操作

    pandas是一个Python语言的软件包,在我们使用Python语言进行机器学习编程的时候,这是一个非常常用的基础编程库.本文是对它的一个入门教程. pandas提供了快速,灵活和富有表现力的数据结 ...

  2. AI基础:机器学习简易入门

    0.导语 Machine Learning(机器学习)是研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能.它是人工智能的核心,是使计算机具有智 ...

  3. python《pandas入门》实现Excel数据字段的拆分

    ** python<pandas入门>实现Excel数据字段的拆分 ,简单说一下自己为什么写博客,主要原因如下: 1,先简单介绍下自己,我是药学本科毕业,工作几年了.在这几年里做过药物相关 ...

  4. 机器学习简易入门-附推荐学习资料

    目录 (1)机器学习正规学习路线 (2)机器学习快速入门 (3)总结 感谢黄海广博士的分享 原创: 机器学习初学者 机器学习初学者 今天 机器学习如何入门?目前没有明确的答案.本站面向广大初学者,推荐 ...

  5. 机器学习从入门到创业手记-应用与实践

    结束了sklearn的培训的同时也迎来了阶段考核,经过这段时间的学习除了发我对机器学习有所入门,另外也发现了高维已经天天和刘思聪出双入对了,但两个人均矢口否认两人的关系,由于刘思聪坐我旁边,我也时常听 ...

  6. python机器学习快速入门

    机器学习快速入门 这是机器学习小白在csdn更新的第一篇文,课程学习资料来源于黑马程序员的3天快速入门python机器学习课程.由于本小白在学完特征工程后转去看吴恩达在coursera的机器学习课程 ...

  7. 深度学习-机器学习从入门到深入全套资源分享

    深度学习.机器学习从入门到深入,全套资源分享.涉及深度学习.机器学习数学.算法基础理论.实战和工程开发相关最佳资源.深度学习常用模型相关教程,深度学习模型优化.调参相关技巧:深度学习常用的框架,公开数 ...

  8. 【直播】耿远昊:Pandas入门讲解(安泰第四届数据科学训练营)

    Pandas入门讲解 直播信息 主讲人:耿远昊,Datawhale成员,joyful-pandas作者. 直播时间:2021年04月07日 20:00~21:00 直播内容: 时间序列中的必知必会: ...

  9. python花萼长度表_Python 数据分析答疑 5:Pandas入门

    8.23 第五课 Pandas入门作业 1: 使用如下代码创建 DataFrame, gdp = {"country":["United States", &q ...

  10. python使用教程pandas-十分钟搞定pandas(入门教程)

    本文是对pandas官方网站上<10Minutes to pandas>的一个简单的翻译,原文在这里.这篇文章是对pandas的一个简单的介绍,详细的介绍请参考:Cookbook .习惯上 ...

最新文章

  1. java对象转json字符串日期格式_fastJSON字符串类型数据中的日期转换为Java bean的日期对象...
  2. cmakelist 寻找opencv
  3. 25接口之间的单继承
  4. Centos下MySql用户管理
  5. ETL的数据同步工具调研(持续更新中)
  6. 【蜕变之路】第29天 CAST和CONVERT的区别(2019年3月19日)
  7. linux nginx安装
  8. 一个我自己建的程序员资料分享站
  9. 【转】粒子滤波简介以及相关技术探讨
  10. Unix/Linux环境C编程入门教程(20) 搭建基于Mac的 Xcode 与 QT 开发环境
  11. 复盘2020:那些崛起的公司
  12. 集合查询和查询结果处理
  13. 再来学习一下RT-Thread的软件架构 | 文末赠书5本《软件架构实践》
  14. 你听说过史莱姆吗??【oj】
  15. SpringMVC 上传文件或图片并以二进制流的方式存到数据库
  16. 《密码安全新技术》课程总结报告
  17. 福州大学计算机考研-一位二战考生的点点滴滴(连载1/5)
  18. 20155305乔磊2016-2017-2《Java程序设计》第三周学习总结
  19. 找男朋友软件测试大乐,抖音2020男朋友测试题答题
  20. 怎样在VI编辑器中使用鼠标移动光标(鼠标点哪里,光标移动到哪里)

热门文章

  1. QQ互联与财付通将打通登录态,移动支付更便捷
  2. springboot知识一
  3. utgard连接opcserver报错Caused by: org.jinterop.dcom.common.JIRuntimeException: Access is denied. [0x800
  4. RKMPP API安装使用总结
  5. java dtu 采集程序_DTU脚本编程_本地采集脚本指令详解
  6. 推荐系统(四)Field-aware Factorization Machines(FFM)
  7. WIN10 系统下下载安装YOLOV4并使用GPU加速(保姆级)
  8. win7桌面的计算机在哪里,win7更改桌面路径,win7桌面文件在哪里
  9. CentOS 8 已经不再支持,Rocky Linux 才是未来
  10. Android 颜色渐变 属性动画