本文实例讲述了Python实现的统计文章单词次数功能。分享给大家供大家参考,具体如下:

题目是这样的:你有一个目录,放了你一个月的日记,都是 txt,为了避免分词的问题,假设内容都是英文,请统计出你认为每篇日记最重要的词。

其实就是统计一篇文章出现最多的单词,但是要去除那些常见的连词、介词和谓语动词等,代码:

#coding=utf-8

import collections

import re

import os

useless_words=('the','a','an','and','by','of','in','on','is','to')

def get_important_word(file):

f=open(file)

word_counter=collections.Counter()

for line in f:

words=re.findall('\w+',line.lower())

word_counter.update(words)

f.close()

most_important_word=word_counter.most_common(1)[0][0]

count=2

while(most_important_word in useless_words):

most_important_word=word_counter.most_common(count)[count-1][0]

count+=1

num=word_counter.most_common(count)[count-1][1]

print 'the most important word in %s is %s,it appears %d times'%(file,most_important_word,num)

if __name__=='__main__':

filepath='.'

for dirpath,dirname,dirfiles in os.walk(filepath):

for file in dirfiles:

if os.path.splitext(file)[1]=='.txt':

abspath=os.path.join(dirpath,file)

if os.path.isfile(abspath):

get_important_word(abspath)

学习笔记:

collections模块,是python内建的模块,提供了许多有用的集合类。我们这里用到了Counter类和其中的most_common()方法

PS:这里再为大家推荐2款相关统计工具供大家参考:

希望本文所述对大家Python程序设计有所帮助。

python统计英文句子每个单词字数_Python实现的统计文章单词次数功能示例相关推荐

  1. python爬取新闻标题存入文本_Python视频爬虫实现下载头条视频功能示例

    本文实例讲述了Python视频爬虫实现下载头条视频功能.分享给大家供大家参考,具体如下: 一.需求分析 抓取头条短视频 思路: 分析网页源码,查找解析出视频资源url(查看源代码,搜mp4) 对该ur ...

  2. python统计文章单词次数_Python实现的统计文章单词次数功能示例

    本文实例讲述了Python实现的统计文章单词次数功能.分享给大家供大家参考,具体如下: 题目是这样的:你有一个目录,放了你一个月的日记,都是 txt,为了避免分词的问题,假设内容都是英文,请统计出你认 ...

  3. java统计每个单词单词出现的次数_Java统计英文句子中出现次数最多的单词并计算出现次数的方法...

    本文实例讲述了Java统计英文句子中出现次数最多的单词并计算出现次数的方法.分享给大家供大家参考,具体如下: import java.util.*; /** * 统计出现次数最多的单词和它出现的次数 ...

  4. 输入一段英文句子(无标点),每两个单词空格隔开,统计单词的平均长度。

    105,输入一段英文句子(无标点),每两个单词空格隔开,统计单词的平均长度. 提示:空格数+1就是单词数. str=input() n=str.count(' ')+1 list=list(str.s ...

  5. 统计英文句子中的单词个数,并且输出每个单词

    package new_test; import java.util.Scanner; import java.util.StringTokenizer; //任务:统计英文句子中的单词个数,并且输出 ...

  6. java 单词出现次数_Java统计英文句子中出现次数最多的单词并计算出现次数的方法...

    搜索热词 本文实例讲述了Java统计英文句子中出现次数最多的单词并计算出现次数的方法.分享给大家供大家参考,具体如下: import java.util.*; /** * 统计出现次数最多的单词和它出 ...

  7. python统计英文句子每个单词字数_Python小书3-文本英文单词统计

    之前写Python Web小书第三小节本来用的垃圾邮件的案例三郎:Python贝叶斯推理垃圾邮件分类​zhuanlan.zhihu.com 后来发现里面的东西,涉及到概率,程序太复杂了...哈哈哈 所 ...

  8. python统计英文文章中单词出现的次数并排序_Python实现的统计文章单词次数功能示例...

    本文实例讲述了Python实现的统计文章单词次数功能.分享给大家供大家参考,具体如下: 题目是这样的:你有一个目录,放了你一个月的日记,都是 txt,为了避免分词的问题,假设内容都是英文,请统计出你认 ...

  9. 统计英文句子中有多少个英文单词 单词之间用空格分开

    #include<iostream> #include<string.h> using namespace std; void main() { int i,j=0; char ...

最新文章

  1. 前后端分离djangorestframework—— 在线视频平台接入第三方加密防盗录视频
  2. 解决IndexClosedException: closed
  3. 机器学习系列3:能量函数分析
  4. 【论文解读】ICLR 2021 |可信多模态机器学习:兼听则明,信而有征
  5. Linux驱动编程 step-by-step (十) Linux 内核链表
  6. No module named pycurl(无法使用yum和pip的情况下的解决方案)
  7. JavaEE——Spring4--(9)Spring的事务管理(注解方式)
  8. git 理解 远程分支
  9. Microsoft Expression Web Designer April CTP Release
  10. 亚里士多德对于知识的分类
  11. 中小软件企业管理存在的问题
  12. kali中exiftool命令查看图片exif信息
  13. ipip.net IP位置信誉信息爬取
  14. Scalar的基础篇(零)简单介绍
  15. echart横轴文字显示省略号_Echarts X轴内容过长自动隐藏,鼠标移动上去显示全部名称方法...
  16. oracle出现101,oracle常见问题(101-200)
  17. dapr的consistent hash
  18. 如何保护您的网站免受恶意软件的侵害
  19. 贡献三个可以查找免费代理服务器的网址
  20. 关于三次握手与四次挥手的超详细解释

热门文章

  1. WhatsApp被禁止使用后如何解封?亲测有效,不懂千万别去乱操作
  2. oracle数据类型
  3. C++ 数组与结构体初始化列表
  4. 【计算机二进制计算】
  5. 10. 创业 - 离开
  6. HBuilderX 编辑代码保存后 微信开发者工具无法自动刷新
  7. AR-透明背景视频解决方案
  8. 工业互联网也迈入新的发展阶段 AI助力构建新型制造体系
  9. 58、NeuMan: Neural Human Radiance Field from a Single Video
  10. 微信开发者工具的目录