公众号:尤而小屋
作者:Peter
编辑:Peter

本文主要是介绍的自己在平时使用Pandas处理数据过程中接触到的高频技巧。以前的Pandas文章有对不同知识点的拆解,欢迎阅读。

Pandas连载文章

图解Pandas数据合并:concat、join、append

创建DataFrame:10种方式任你选

赞!五花八门的Pandas筛选数据

数据处理基石:数据探索

高频技巧

使用的技巧主要是下图涉及到的:

import pandas as pd
import numpy as np

导入文件

Pandas能够读取很多文件:Excel、CSV、数据库、TXT,甚至是在线的文件都是OK的

创建DataFrame

在以前的文章中介绍过10种DataFrame的方法

查看头尾数据

头尾都是默认5行数据,可以指定行数

# df2.head()  默认头部5行
df2.head(3)  # 指定3行# df2.tail()  默认尾部5行
df2.tail(2)  # 指定尾部2行

显示全部列名

显示索引

查看列的数据类型

查看行列数

查看数据大小

查看缺失值

修改列名

两种方式:使用rename函数和直接使用columns属性

统计元素

统计每个元素的个数

转成列表数据

提取列中数据

提取文本数据

数值范围数据提取

提取整列数据

缺失值填充

  • 指定填充的值

  • 用计算值

  • 用其他值

数据去重

计算统计值

计算统计值,比如最值和均值等

计算中位数

提取最值所在的行

Pandas切片

df2.iloc[22]  # 提取某个行的数据
df2.iloc[:,1:6]  # 行和列上的切片

大小排序

分组聚合

使用groupby分组之后,对不同的字段可以使用不同的聚合函数

索引重排

注意和上面例子的比较。使用的是reset_index函数

去掉原索引

使用索引重排之后我们需要去掉原来的索引;比较上下两个结果的区别。通过drop=True来实现


apply函数

两个列相加

DataFrame合并

1、先看看两个原始数据

2、默认情况:求的两个DF的交集

3、保留左边全部数据

4、保留右边全部数据

how="inner"其实就是默认情况:

导出数据

导出数据的时候通常是不需要索引的

往期精彩回顾适合初学者入门人工智能的路线及资料下载机器学习及深度学习笔记等资料打印机器学习在线手册深度学习笔记专辑《统计学习方法》的代码复现专辑
AI基础下载黄海广老师《机器学习课程》视频课黄海广老师《机器学习课程》711页完整版课件

本站qq群851320808,加入微信群请扫码:

【Python】30个Pandas高频使用技巧相关推荐

  1. 人生苦短,Python值得 这些Pandas隐藏小技巧你知道吗?

    全文共2501字,预计学习时长7分钟 图源:unsplash 作为一名数据分析师或数据科学家,不了解Python中的Pandas库是无论如何说不过去的,它已经成为Python中用来整理.清理数据的标准 ...

  2. 干货!整理了50个 Pandas 高频使用技巧,强烈建议收藏!

    作者 | 俊欣 来源 | 关于数据分析与可视化 今天小编来分享在pandas当中经常会被用到的方法,篇幅可能有点长但是提供的都是干货,读者朋友们看完之后也可以点赞收藏,相信会对大家有所帮助,大致本文会 ...

  3. pandas fillna_【Python基础】快速提升效率的6个pandas使用小技巧

    文章来源:towardsdatascience 作者:B.Chen 翻译\编辑:Python大数据分析 pandas是python中常用的数据分析库,出现频率非常高,而且pandas功能之多让人咋舌, ...

  4. 【Python基础】快速提升效率的6个pandas使用小技巧

    文章来源:towardsdatascience 作者:B.Chen  翻译\编辑:Python大数据分析 pandas是python中常用的数据分析库,出现频率非常高,而且pandas功能之多让人咋舌 ...

  5. 人生苦短,Python值得!这些Pandas隐藏小技巧你知道吗?

    全文共2501字,预计学习时长7分钟 作为一名数据分析师或数据科学家,不了解Python中的Pandas库是无论如何说不过去的,它已经成为Python中用来整理.清理数据的标准工具了. 然而,关于Pa ...

  6. python自学教程推荐-学习python中的pandas有没有好的教程推荐?

    上来就丢教程和资料,其实是把路带偏了!找到学习Pandas的方法比找教程重要的多!现在无论是学习Python还是Pandas,最大的问题不是没有资料,而恰恰是太多资料和教程,让人抓不住头绪. 很多凭着 ...

  7. python对excel某一列去重-「总结篇」Python中所有的Excel操作技巧

    原标题:「总结篇」Python中所有的Excel操作技巧 Python对于Excel的操作是多种多样的,掌握了相关用法就可以随心所欲的操作数据了! 操作xls文件 xlrd(读操作): import ...

  8. (转载)Python数据分析之pandas学习

    转载地址:http://www.cnblogs.com/nxld/p/6058591.html Python中的pandas模块进行数据分析. 接下来pandas介绍中将学习到如下8块内容: 1.数据 ...

  9. 快速提高Python数据分析速度的八个技巧

    今天整理了几个在使用python进行数据分析的常用小技巧.命令.记得搭配Pandas+Jupyter Notebook使用哦. 01 使用Pandas  Profiling预览数据 这个神器我们在之前 ...

最新文章

  1. java kryo_kryo序列化 - Java序列化期间的错误
  2. vue保存内容到本地_Vue两个版本区别
  3. selenium + python自动化测试unittest框架学习(五)webdriver的二次封装
  4. xlwt什么版本支持xlsx的版本_Spring Framework Versions版本支持说明
  5. 基于(7, 5)归零非删余Turbo码的参数识别与分析
  6. java spring获取bean_普通Java类获取Spring的Bean的方法
  7. A股开盘:深证区块链50指数涨0.91%,美邦服饰涨停
  8. 图像标注,三倍加速:谷歌AI新方案,数据民工的福音 | Demo可玩耍
  9. JavaScript学习手册五:JS数组
  10. 法曲率、主曲率、平均曲率和高斯曲率
  11. RGMII(Reduced Gigabit Media Independent Interface)
  12. 用 Python 编辑 PDF 文件
  13. python使用 Captcha 模块来生成验证码图片
  14. hdu5442 后缀数组
  15. 火狐配置 about:config介绍:
  16. 关于本人树莓派捣鼓过程中的一些记录
  17. 将图片转化成SVG格式(亲测可行)
  18. Storj:A Peer-to-Peer Cloud Storage Network(点对点云存储网络)
  19. Centos7安装配置
  20. [COPY]《京东技术解密》——海量订单处理

热门文章

  1. javascript 运算优先级
  2. 如何用conda安装软件|处理conda安装工具的动态库问题
  3. 湖南雅礼培训 1.1
  4. 开发高性能JAVA应用程序基础(内存篇)
  5. C++中的虚函数(virtual function)
  6. 【PHP】函数的引用返回
  7. 【郭林专刊】JSP中JSTL提供的函数标签EL表达式操作字符串的方法
  8. python股票数据预处理_Python股票处理之六_数据预处理A
  9. Science nature合集 2021年度上半年
  10. 计算机视觉与深度学习 | 粒子群算法与遗传算法(GA)及与蚁群算法(ACO)比较