介绍一下如何在python里使用value_counts( )和counts( )进行计数。

一、counts( )函数

1、count()在字符串里的使用

函数体及主要参数:

count(str,start=0 ,end=len(string)

str:要搜索的子字符串

start:开始搜索的位置,默认是0,也就是从第一个字符开始搜索。

end:结束搜索的位置,默认在最后一个字符停止搜索。

实验一下~

首先我们还是先构建一个字符串:

df_str="abcabcdabcdeab5343实验字符串串串串"
df_str

统计一下字符“a”的个数:

统计一下字符“3”的个数:

统计一下字符“串”的个数:

题外小知识:

输出结果的时候,其实L更推荐使用format()函数进行输出,这也是一种更实用的输出方式,类似上面的输出结果,我们可以用format( )进行更高级的输出:

print("统计一下字符 'a' 的个数: \n{}".format(df_str.count('a')))

等以后有空再写一篇关于输入输出的文章~

2、count( )在列表里的使用

创建一个实验列表:

a=[1,2,3,4,5,4,4,4,2,'a','b','a','子','子']

大家注意看下面6种情况下,不同的输出结果:

也就是说在使用的时候,要根据数值类型的不同,正确区别字符。

二、value_counts( )函数

在pandas中,value_counts常用于数据表的计数及排序,它可以用来查看数据表中,指定列里有多少个不同的数据值,并计算每个不同值有在该列中的个数,同时还能根据需要进行排序。

函数体及主要参数:

value_counts(values,sort=True, ascending=False, normalize=False,bins=None,dropna=True)

sort=True: 是否要进行排序;默认进行排序
ascending=False: 默认降序排列;
normalize=False: 是否要对计算结果进行标准化并显示标准化后的结果,默认是False。
bins=None: 可以自定义分组区间,默认是否;
dropna=True:是否删除缺失值nan,默认删除

首先,我们还是先创建一个数据表:

import pandas as pd
import numpy as np
df = pd.DataFrame({'城市':['北京','广州', '天津', '上海', '杭州', '成都', '澳门', '南京','北京','北京'], '收入':[10000, 10000, 5000, 5002, 40000, 50000, 8000, 5000,5000,5000],'年龄':[50, 43, 34, 40, 25, 25, 45, 32,25,25]})
df.set_index([["一","二","三","四","五","六","七","八","九","十"]],inplace=True)
df

(1)查看“城市”这一列的计数结果:

可以看到,默认降序排列;

(2)采用升序的方式,查看“收入”这一列:

df['收入'].value_counts(ascending=True)

(3)使用标准化normalize=True的方法,查看“年龄”这一列的计数占比:

df['年龄'].value_counts(ascending=True,normalize=True)

PS:缺失值是默认被删除的,也就是不被计算其中~

而且,如果要计数的对象是numpy里的ndarray类型的话,可以用size的方法,同样可以达到上述的效果,这里就不举例了~

pandas计数函数 :value_counts( )和counts( )的使用相关推荐

  1. Python pandas数据计数函数value_counts

    value_counts介绍 value_counts是一种查看表格某列中有多少个不同值的快捷方法,并计算每个不同值有在该列中个数,类似Excel里面的count函数 其是pandas下面的顶层函数, ...

  2. python3 value counts函数_pandas计数函数 :value_counts( )和counts( )的使用

    在我们使用pandas进行数据分析时,时常需要对数据进行排序.计量,以获取数据的某些信息,在之前的文章中,我已经为大家介绍过如何用如何使用sort_value函数对数据进行排序,(忘记的同学可以在下面 ...

  3. pandas计数函数 :value_counts( )的使用

    在pandas中,value_counts常用于数据表的计数及排序,它可以用来查看数据表中,指定列里有多少个不同的数据值,并计算每个不同值在该列中的个数,同时还能根据需要进行排序. 函数体及主要参数: ...

  4. value_counts()计数的用法

    value_counts() 方法返回一个序列 Series,该序列包含每个值的数量.也就是说,对于数据框中的任何列,value-counts () 方法会返回该列每个项的计数. value_coun ...

  5. Python:启程 数据分析-牛客网在线编程-中级函数12-23

    DA12 牛客网不同语言使用人数 当时没有做出来,看答案发现有pandas 计数函数value_counts(),详解参考了以下博主的文章 python value_counts()的基础及进阶用法( ...

  6. python3 value counts函数_如何使用value_counts()返回的值进行进一步的计算?

    我有一个名为y_ocsvm的列,它在名为step1的df中填充了1和-1.在 我使用:step1['y_ocsvm'].value_counts()来获得1和-1的计数,结果是:step1['y_oc ...

  7. 9个value_counts()的小技巧,提高Pandas 数据分析效率

    来源:DeepHub IMBA本文约1800字,建议阅读5分钟 我们将探讨 Pandas value_counts() 的不同用例. 数据科学家通常将大部分时间花在探索和预处理数据上.当谈到数据分析和 ...

  8. python3 value counts函数_pandas计数 value_counts()的使用

    在pandas里面常用value_counts确认数据出现的频率. 1. Series 情况下: pandas 的 value_counts() 函数可以对Series里面的每个值进行计数并且排序. ...

  9. 9个value_counts()的小技巧,提高Pandas 改进数据分析效率

    数据科学家通常将大部分时间花在探索和预处理数据上. 当谈到数据分析和理解数据结构时,Pandas value_counts() 是最受欢迎的函数之一. 该函数返回一个包含唯一值计数的系列. 生成的Se ...

最新文章

  1. 大数据成败之“监”:美团数据质量监管平台这样搭建
  2. 1月第4周中美五大顶级域名总量涨幅相近 均有5.4万个
  3. Spring中@Autowired、@Qualifier、@Resource的区别
  4. system 无法以 sysdba 登录,提示:权限不足。
  5. Zabbix监控指定端口的步骤
  6. [翻译]Writing Custom Wizards 编写自定义的向导
  7. linux运维工程师的发展,Linux运维工程师发展前景
  8. 一步步教你如何实现小程序倒计时三二一后跳转页面功能,附加倒计时过渡动画
  9. 搭建自己的wiki系统
  10. 四十六、Stata离散选择模型,时间序列和面板数据
  11. 六十星系之03廉贞天府坐辰戌
  12. 微信小程序普通二维码解析
  13. Verilog学习笔记4:关于5M40ZE64C4N接地的问题
  14. KingbaseES数据库对象管理工具
  15. MAC UltraEdit18.00.0.40 绿色版,亲测有效
  16. 第六十九章 Caché 函数大全 $WCHAR 函数
  17. GBase8s数据库GRANT 语句
  18. 头条的动态页面爬取+百度下拉搜索框
  19. 【OpenCV入门学习--python】图像的矩Image Moments
  20. 中国国内投资者如何才能炒美股?

热门文章

  1. 第十一章 字符串
  2. 【大数据开发运维解决方案】ssh: undefined symbol: EVP_KDF_ctrl, version OPENSSL_1_1_1b问题解决过程
  3. EPSON RX8010SJ RTC 调试笔记之五, 固定周期定时中断功能 (Fixed-cycle Timer Interrupt Function)
  4. 相关性质和条件变量-ReentrantLock详解(2)-AQS-并发编程(Java)
  5. “IT列国”之“商鞅变法” ——IT企业的流程再造项目
  6. 永远不要去依赖别人_不要太依赖一个人说说 永远都不要依赖任何人的经典句子...
  7. linux服务器搭建之路7-通过rdesktop远程连接win10
  8. 微任务和宏任务的区别及具体场景
  9. ES和Kibana设置账号密码
  10. 80后、90后、00后互联网人如何找工作