python统计英文句子每个单词字数_Python实现的统计文章单词次数功能示例
本文实例讲述了Python实现的统计文章单词次数功能。分享给大家供大家参考,具体如下:
题目是这样的:你有一个目录,放了你一个月的日记,都是 txt,为了避免分词的问题,假设内容都是英文,请统计出你认为每篇日记最重要的词。
其实就是统计一篇文章出现最多的单词,但是要去除那些常见的连词、介词和谓语动词等,代码:
#coding=utf-8
import collections
import re
import os
useless_words=('the','a','an','and','by','of','in','on','is','to')
def get_important_word(file):
f=open(file)
word_counter=collections.Counter()
for line in f:
words=re.findall('\w+',line.lower())
word_counter.update(words)
f.close()
most_important_word=word_counter.most_common(1)[0][0]
count=2
while(most_important_word in useless_words):
most_important_word=word_counter.most_common(count)[count-1][0]
count+=1
num=word_counter.most_common(count)[count-1][1]
print 'the most important word in %s is %s,it appears %d times'%(file,most_important_word,num)
if __name__=='__main__':
filepath='.'
for dirpath,dirname,dirfiles in os.walk(filepath):
for file in dirfiles:
if os.path.splitext(file)[1]=='.txt':
abspath=os.path.join(dirpath,file)
if os.path.isfile(abspath):
get_important_word(abspath)
学习笔记:
collections模块,是python内建的模块,提供了许多有用的集合类。我们这里用到了Counter类和其中的most_common()方法
PS:这里再为大家推荐2款相关统计工具供大家参考:
希望本文所述对大家Python程序设计有所帮助。
python统计英文句子每个单词字数_Python实现的统计文章单词次数功能示例相关推荐
- python爬取新闻标题存入文本_Python视频爬虫实现下载头条视频功能示例
本文实例讲述了Python视频爬虫实现下载头条视频功能.分享给大家供大家参考,具体如下: 一.需求分析 抓取头条短视频 思路: 分析网页源码,查找解析出视频资源url(查看源代码,搜mp4) 对该ur ...
- python统计文章单词次数_Python实现的统计文章单词次数功能示例
本文实例讲述了Python实现的统计文章单词次数功能.分享给大家供大家参考,具体如下: 题目是这样的:你有一个目录,放了你一个月的日记,都是 txt,为了避免分词的问题,假设内容都是英文,请统计出你认 ...
- java统计每个单词单词出现的次数_Java统计英文句子中出现次数最多的单词并计算出现次数的方法...
本文实例讲述了Java统计英文句子中出现次数最多的单词并计算出现次数的方法.分享给大家供大家参考,具体如下: import java.util.*; /** * 统计出现次数最多的单词和它出现的次数 ...
- 输入一段英文句子(无标点),每两个单词空格隔开,统计单词的平均长度。
105,输入一段英文句子(无标点),每两个单词空格隔开,统计单词的平均长度. 提示:空格数+1就是单词数. str=input() n=str.count(' ')+1 list=list(str.s ...
- 统计英文句子中的单词个数,并且输出每个单词
package new_test; import java.util.Scanner; import java.util.StringTokenizer; //任务:统计英文句子中的单词个数,并且输出 ...
- java 单词出现次数_Java统计英文句子中出现次数最多的单词并计算出现次数的方法...
搜索热词 本文实例讲述了Java统计英文句子中出现次数最多的单词并计算出现次数的方法.分享给大家供大家参考,具体如下: import java.util.*; /** * 统计出现次数最多的单词和它出 ...
- python统计英文句子每个单词字数_Python小书3-文本英文单词统计
之前写Python Web小书第三小节本来用的垃圾邮件的案例三郎:Python贝叶斯推理垃圾邮件分类zhuanlan.zhihu.com 后来发现里面的东西,涉及到概率,程序太复杂了...哈哈哈 所 ...
- python统计英文文章中单词出现的次数并排序_Python实现的统计文章单词次数功能示例...
本文实例讲述了Python实现的统计文章单词次数功能.分享给大家供大家参考,具体如下: 题目是这样的:你有一个目录,放了你一个月的日记,都是 txt,为了避免分词的问题,假设内容都是英文,请统计出你认 ...
- 统计英文句子中有多少个英文单词 单词之间用空格分开
#include<iostream> #include<string.h> using namespace std; void main() { int i,j=0; char ...
最新文章
- 前后端分离djangorestframework—— 在线视频平台接入第三方加密防盗录视频
- 解决IndexClosedException: closed
- 机器学习系列3:能量函数分析
- 【论文解读】ICLR 2021 |可信多模态机器学习:兼听则明,信而有征
- Linux驱动编程 step-by-step (十) Linux 内核链表
- No module named pycurl(无法使用yum和pip的情况下的解决方案)
- JavaEE——Spring4--(9)Spring的事务管理(注解方式)
- git 理解 远程分支
- Microsoft Expression Web Designer April CTP Release
- 亚里士多德对于知识的分类
- 中小软件企业管理存在的问题
- kali中exiftool命令查看图片exif信息
- ipip.net IP位置信誉信息爬取
- Scalar的基础篇(零)简单介绍
- echart横轴文字显示省略号_Echarts X轴内容过长自动隐藏,鼠标移动上去显示全部名称方法...
- oracle出现101,oracle常见问题(101-200)
- dapr的consistent hash
- 如何保护您的网站免受恶意软件的侵害
- 贡献三个可以查找免费代理服务器的网址
- 关于三次握手与四次挥手的超详细解释