pandas计数函数 :value_counts( )和counts( )的使用
介绍一下如何在python里使用value_counts( )和counts( )进行计数。
一、counts( )函数
1、count()在字符串里的使用
函数体及主要参数:
count(str,start=0 ,end=len(string)
str:要搜索的子字符串
start:开始搜索的位置,默认是0,也就是从第一个字符开始搜索。
end:结束搜索的位置,默认在最后一个字符停止搜索。
实验一下~
首先我们还是先构建一个字符串:
df_str="abcabcdabcdeab5343实验字符串串串串"
df_str
统计一下字符“a”的个数:
统计一下字符“3”的个数:
统计一下字符“串”的个数:
题外小知识:
输出结果的时候,其实L更推荐使用format()函数进行输出,这也是一种更实用的输出方式,类似上面的输出结果,我们可以用format( )进行更高级的输出:
print("统计一下字符 'a' 的个数: \n{}".format(df_str.count('a')))
等以后有空再写一篇关于输入输出的文章~
2、count( )在列表里的使用
创建一个实验列表:
a=[1,2,3,4,5,4,4,4,2,'a','b','a','子','子']
大家注意看下面6种情况下,不同的输出结果:
也就是说在使用的时候,要根据数值类型的不同,正确区别字符。
二、value_counts( )函数
在pandas中,value_counts常用于数据表的计数及排序,它可以用来查看数据表中,指定列里有多少个不同的数据值,并计算每个不同值有在该列中的个数,同时还能根据需要进行排序。
函数体及主要参数:
value_counts(values,sort=True, ascending=False, normalize=False,bins=None,dropna=True)
sort=True: 是否要进行排序;默认进行排序
ascending=False: 默认降序排列;
normalize=False: 是否要对计算结果进行标准化并显示标准化后的结果,默认是False。
bins=None: 可以自定义分组区间,默认是否;
dropna=True:是否删除缺失值nan,默认删除
首先,我们还是先创建一个数据表:
import pandas as pd
import numpy as np
df = pd.DataFrame({'城市':['北京','广州', '天津', '上海', '杭州', '成都', '澳门', '南京','北京','北京'], '收入':[10000, 10000, 5000, 5002, 40000, 50000, 8000, 5000,5000,5000],'年龄':[50, 43, 34, 40, 25, 25, 45, 32,25,25]})
df.set_index([["一","二","三","四","五","六","七","八","九","十"]],inplace=True)
df
(1)查看“城市”这一列的计数结果:
可以看到,默认降序排列;
(2)采用升序的方式,查看“收入”这一列:
df['收入'].value_counts(ascending=True)
(3)使用标准化normalize=True的方法,查看“年龄”这一列的计数占比:
df['年龄'].value_counts(ascending=True,normalize=True)
PS:缺失值是默认被删除的,也就是不被计算其中~
而且,如果要计数的对象是numpy里的ndarray类型的话,可以用size的方法,同样可以达到上述的效果,这里就不举例了~
pandas计数函数 :value_counts( )和counts( )的使用相关推荐
- Python pandas数据计数函数value_counts
value_counts介绍 value_counts是一种查看表格某列中有多少个不同值的快捷方法,并计算每个不同值有在该列中个数,类似Excel里面的count函数 其是pandas下面的顶层函数, ...
- python3 value counts函数_pandas计数函数 :value_counts( )和counts( )的使用
在我们使用pandas进行数据分析时,时常需要对数据进行排序.计量,以获取数据的某些信息,在之前的文章中,我已经为大家介绍过如何用如何使用sort_value函数对数据进行排序,(忘记的同学可以在下面 ...
- pandas计数函数 :value_counts( )的使用
在pandas中,value_counts常用于数据表的计数及排序,它可以用来查看数据表中,指定列里有多少个不同的数据值,并计算每个不同值在该列中的个数,同时还能根据需要进行排序. 函数体及主要参数: ...
- value_counts()计数的用法
value_counts() 方法返回一个序列 Series,该序列包含每个值的数量.也就是说,对于数据框中的任何列,value-counts () 方法会返回该列每个项的计数. value_coun ...
- Python:启程 数据分析-牛客网在线编程-中级函数12-23
DA12 牛客网不同语言使用人数 当时没有做出来,看答案发现有pandas 计数函数value_counts(),详解参考了以下博主的文章 python value_counts()的基础及进阶用法( ...
- python3 value counts函数_如何使用value_counts()返回的值进行进一步的计算?
我有一个名为y_ocsvm的列,它在名为step1的df中填充了1和-1.在 我使用:step1['y_ocsvm'].value_counts()来获得1和-1的计数,结果是:step1['y_oc ...
- 9个value_counts()的小技巧,提高Pandas 数据分析效率
来源:DeepHub IMBA本文约1800字,建议阅读5分钟 我们将探讨 Pandas value_counts() 的不同用例. 数据科学家通常将大部分时间花在探索和预处理数据上.当谈到数据分析和 ...
- python3 value counts函数_pandas计数 value_counts()的使用
在pandas里面常用value_counts确认数据出现的频率. 1. Series 情况下: pandas 的 value_counts() 函数可以对Series里面的每个值进行计数并且排序. ...
- 9个value_counts()的小技巧,提高Pandas 改进数据分析效率
数据科学家通常将大部分时间花在探索和预处理数据上. 当谈到数据分析和理解数据结构时,Pandas value_counts() 是最受欢迎的函数之一. 该函数返回一个包含唯一值计数的系列. 生成的Se ...
最新文章
- 大数据成败之“监”:美团数据质量监管平台这样搭建
- 1月第4周中美五大顶级域名总量涨幅相近 均有5.4万个
- Spring中@Autowired、@Qualifier、@Resource的区别
- system 无法以 sysdba 登录,提示:权限不足。
- Zabbix监控指定端口的步骤
- [翻译]Writing Custom Wizards 编写自定义的向导
- linux运维工程师的发展,Linux运维工程师发展前景
- 一步步教你如何实现小程序倒计时三二一后跳转页面功能,附加倒计时过渡动画
- 搭建自己的wiki系统
- 四十六、Stata离散选择模型,时间序列和面板数据
- 六十星系之03廉贞天府坐辰戌
- 微信小程序普通二维码解析
- Verilog学习笔记4:关于5M40ZE64C4N接地的问题
- KingbaseES数据库对象管理工具
- MAC UltraEdit18.00.0.40 绿色版,亲测有效
- 第六十九章 Caché 函数大全 $WCHAR 函数
- GBase8s数据库GRANT 语句
- 头条的动态页面爬取+百度下拉搜索框
- 【OpenCV入门学习--python】图像的矩Image Moments
- 中国国内投资者如何才能炒美股?
热门文章
- 第十一章 字符串
- 【大数据开发运维解决方案】ssh: undefined symbol: EVP_KDF_ctrl, version OPENSSL_1_1_1b问题解决过程
- EPSON RX8010SJ RTC 调试笔记之五, 固定周期定时中断功能 (Fixed-cycle Timer Interrupt Function)
- 相关性质和条件变量-ReentrantLock详解(2)-AQS-并发编程(Java)
- “IT列国”之“商鞅变法” ——IT企业的流程再造项目
- 永远不要去依赖别人_不要太依赖一个人说说 永远都不要依赖任何人的经典句子...
- linux服务器搭建之路7-通过rdesktop远程连接win10
- 微任务和宏任务的区别及具体场景
- ES和Kibana设置账号密码
- 80后、90后、00后互联网人如何找工作