【数据】统计汉字字数
实现:
import string
def str_count(str):'''找出字符串中的中英文、空格、数字、标点符号个数'''count_en = 0count_dg = 0count_sp = 0count_zh = 0count_pu = 0for s in str:# 英文if s in string.ascii_letters:count_en += 1# 数字elif s.isdigit():count_dg += 1# 空格elif s.isspace():count_sp += 1# 中文elif s.isalpha():count_zh += 1# 特殊字符else:count_pu += 1return count_zhdef str_count2(str):for s in str:# 中文字符范围if '\u4e00' <= s <= '\u9fff':print(s, end="\t")
示例:去掉文件中单个汉字词
with open('chs.txt', 'r') as open_file:for line in open_file:if str_count(line) > 1: print(line)
参见:
https://blog.csdn.net/xiamoyanyulrq/article/details/81504114
【数据】统计汉字字数相关推荐
- spark 统计汉字字数_版面字数和实际字数一样吗
版面字数和实际字数一样吗?不一样.版面字数,是排版时计算的字数,实际字数是在word中计算的字数,由于计算原则不同,得出了的结果也不同.即版面字数要比实际字数多. 版面字数是一种计算新闻出版物排字数量 ...
- python统计汉字字数_Python 统计字数的思路详解
问题描述: 用 Python 实现函数 count_words(),该函数输入字符串 s 和数字 n,返回 s 中 n 个出现频率最高的单词.返回值是一个元组列表,包含出现次数最高的 n 个单词及其次 ...
- python统计文本字数_Python 简单应用--文章字数统计
Python是做数据处理很好的工具,这里小时牛刀,用Python完成文章的字数统计. 系统:Ubuntu16.04 Python版本:3.4 文本:<西游记>txt片段 结果:存放于res ...
- LaTeX 写作的两个辅助工具:统计中文字数和关闭Acrobat中的PDF文档
LaTeX 没有像 Word 那样自带中文字数统计功能,加上 LaTeX 源文件中有许多控制字符,不能通过文件大小获知其中有多少汉字.为此我用C写了一个统计中文字数的小工具,名为 cwc ,即 chi ...
- 怎么统计是否内宿_白杨SEO:工具推荐第十期——网站数据统计工具之百度统计(二)...
序言:为啥想到写这篇呢,上周我付费群里一个小伙伴单独微信我的,想起就补一篇吧,上一篇还是几个月前写的呢,哈哈哈. 因为刚写了一篇权重文章花了我两个多小时.这一篇,我就加快进度了哈.这是一篇下,那我先把 ...
- 城市疫情数据统计C语言课程设计
城市疫情数据统计C语言课程设计(只列出了大体的框架,需要源码的朋友请私信联系.) 1.问题描述 针对疫情记录和统计各类人员的数据. 2.功能要求 (1)数据维护: 涉及疫情的人员类别(确诊.无症状.疑 ...
- Hadoop统计中文字数
#Hadoop统计中文字数代码 import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.Path; impor ...
- linux中grep与wc命令,Linux高效数据统计命令wc
原标题:Linux高效数据统计命令wc 主要参数 常见参数如下: -c 统计字节数. -l 统计行数. -m 统计字符数.这个标志不能与 -c 标志一起使用. -w 统计字数.注意,这里的字指的是由空 ...
- LaTeX 写作的两个辅助工具:统计中文字数和关闭Acrobat中的PDF文档 1
LaTeX 没有像 Word 那样自带中文字数统计功能,加上 LaTeX 源文件中有许多控制字符,不能通过文件大小获知其中有多少汉字.为此我用C写了一个统计中文字数的小工具,名为 cwc ,即 chi ...
最新文章
- Ubuntu下安装mysql与mysql workbench
- filebeat 收集json格式_集群日志收集架构ELK
- 计算机主机安装系统安装系统,系统重装
- pt1000温度对照表_温度传感器的常用检测方法
- conv2d 公式_TF-卷积函数 tf.nn.conv2d 介绍
- 2021年薪资水平报告
- 最大子段和问题Java实现
- 大火金九银十!秋季借势海报PSD分层模板,看谁最能俘获你的心
- Card Trick(模拟)
- graphviz 画决策树_决策树算法-实战篇
- jade安装及基本语法使用
- 如何用开源软件办一场技术大会?
- Android客户端入门开发
- 网约车定价策略:手机越贵打车越贵?
- 爬虫爬出来的数据不全_Web Scraper教程(二)爬虫入门之当当畅销书爬取
- JavaScript 常用事件大全
- 【vulhub】gitea
- .NET Core中Expression<Func<T,bool>>简洁明了
- 面试官通用面试问题---------------经典回答
- tomcat端口占用极其简单解决办法