实现:

import string
def str_count(str):'''找出字符串中的中英文、空格、数字、标点符号个数'''count_en = 0count_dg = 0count_sp = 0count_zh = 0count_pu = 0for s in str:# 英文if s in string.ascii_letters:count_en += 1# 数字elif s.isdigit():count_dg += 1# 空格elif s.isspace():count_sp += 1# 中文elif s.isalpha():count_zh += 1# 特殊字符else:count_pu += 1return count_zhdef str_count2(str):for s in str:# 中文字符范围if '\u4e00' <= s <= '\u9fff':print(s, end="\t")

示例:去掉文件中单个汉字词

with open('chs.txt', 'r') as open_file:for line in open_file:if str_count(line) > 1:  print(line)

参见:
https://blog.csdn.net/xiamoyanyulrq/article/details/81504114

【数据】统计汉字字数相关推荐

  1. spark 统计汉字字数_版面字数和实际字数一样吗

    版面字数和实际字数一样吗?不一样.版面字数,是排版时计算的字数,实际字数是在word中计算的字数,由于计算原则不同,得出了的结果也不同.即版面字数要比实际字数多. 版面字数是一种计算新闻出版物排字数量 ...

  2. python统计汉字字数_Python 统计字数的思路详解

    问题描述: 用 Python 实现函数 count_words(),该函数输入字符串 s 和数字 n,返回 s 中 n 个出现频率最高的单词.返回值是一个元组列表,包含出现次数最高的 n 个单词及其次 ...

  3. python统计文本字数_Python 简单应用--文章字数统计

    Python是做数据处理很好的工具,这里小时牛刀,用Python完成文章的字数统计. 系统:Ubuntu16.04 Python版本:3.4 文本:<西游记>txt片段 结果:存放于res ...

  4. LaTeX 写作的两个辅助工具:统计中文字数和关闭Acrobat中的PDF文档

    LaTeX 没有像 Word 那样自带中文字数统计功能,加上 LaTeX 源文件中有许多控制字符,不能通过文件大小获知其中有多少汉字.为此我用C写了一个统计中文字数的小工具,名为 cwc ,即 chi ...

  5. 怎么统计是否内宿_白杨SEO:工具推荐第十期——网站数据统计工具之百度统计(二)...

    序言:为啥想到写这篇呢,上周我付费群里一个小伙伴单独微信我的,想起就补一篇吧,上一篇还是几个月前写的呢,哈哈哈. 因为刚写了一篇权重文章花了我两个多小时.这一篇,我就加快进度了哈.这是一篇下,那我先把 ...

  6. 城市疫情数据统计C语言课程设计

    城市疫情数据统计C语言课程设计(只列出了大体的框架,需要源码的朋友请私信联系.) 1.问题描述 针对疫情记录和统计各类人员的数据. 2.功能要求 (1)数据维护: 涉及疫情的人员类别(确诊.无症状.疑 ...

  7. Hadoop统计中文字数

    #Hadoop统计中文字数代码 import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.Path; impor ...

  8. linux中grep与wc命令,Linux高效数据统计命令wc

    原标题:Linux高效数据统计命令wc 主要参数 常见参数如下: -c 统计字节数. -l 统计行数. -m 统计字符数.这个标志不能与 -c 标志一起使用. -w 统计字数.注意,这里的字指的是由空 ...

  9. LaTeX 写作的两个辅助工具:统计中文字数和关闭Acrobat中的PDF文档 1

    LaTeX 没有像 Word 那样自带中文字数统计功能,加上 LaTeX 源文件中有许多控制字符,不能通过文件大小获知其中有多少汉字.为此我用C写了一个统计中文字数的小工具,名为 cwc ,即 chi ...

最新文章

  1. Ubuntu下安装mysql与mysql workbench
  2. filebeat 收集json格式_集群日志收集架构ELK
  3. 计算机主机安装系统安装系统,系统重装
  4. pt1000温度对照表_温度传感器的常用检测方法
  5. conv2d 公式_TF-卷积函数 tf.nn.conv2d 介绍
  6. 2021年薪资水平报告
  7. 最大子段和问题Java实现
  8. 大火金九银十!秋季借势海报PSD分层模板,看谁最能俘获你的心
  9. Card Trick(模拟)
  10. graphviz 画决策树_决策树算法-实战篇
  11. jade安装及基本语法使用
  12. 如何用开源软件办一场技术大会?
  13. Android客户端入门开发
  14. 网约车定价策略:手机越贵打车越贵?
  15. 爬虫爬出来的数据不全_Web Scraper教程(二)爬虫入门之当当畅销书爬取
  16. JavaScript 常用事件大全
  17. 【vulhub】gitea
  18. .NET Core中Expression<Func<T,bool>>简洁明了
  19. 面试官通用面试问题---------------经典回答
  20. tomcat端口占用极其简单解决办法

热门文章

  1. 【CH559L单片机】串口下载程序说明
  2. Web从入门到放弃-CSS的学习(五)
  3. mysql如何对字段加密_Mysql 数据库字段加密
  4. java随机数生成三位数_Java随机数总结
  5. 《与巴菲特共进午餐时,我顿悟到的5个真理》精髓:通过投资的5个真理,教你成为一名真正的价值投资者。
  6. 如何理解人工智能、机器学习和深度学习
  7. FindBugs What Why How
  8. 关于启用EBS应收票据的设置
  9. 【5G NR】RRC连接释放
  10. postgre函数007—to_char使用