在本文中利用Python对Hamlet英文词频进行统计,我们解决该问题的基本流程应该如下:

1、读取文件

2、将所有英文字母变成小写

3、根据标点符号,对!'#$%&()*+,-./:;<=>?@[\\]^_‘{|}~等对单词进行分割,形成列表

4、对每个单词进行计数

f1 = open("hamlet.txt",encoding="utf-8")

f2 = f1.read()

text = f2.lower()

str2 = "!'#$%&()*+,-./:;<=>?@[\\]^_‘{|}~"

text=list(text)

number=0

for each in text:

if each in str2:

text[number]=" "

number+=1

text = "".join(text)

word = text.split(" ")

dict1 = dict()

for each in word:

dict1[each] = dict1.get(each,0)+1

items = list(dict1.items())

items.sort(key=lambda x:x[1],reverse=True)

for i in range(100):

print(items[i])

得到结果:

('the', 44680)

('it', 29207)

('and', 26895)

('i', 25662)

('to', 24826)

('a', 20674)

('is', 14564)

('for', 13085)

('my', 12991)

('this', 12519)

('in', 11601)

('of', 10774)

('that', 8605)

('but', 7342)

('t', 7244)

('on', 7098)

('was', 7024)

('we', 6979)

('with', 6935)

('so', 6753)

('baby', 6721)

('s', 6633)

('have', 6547)

('they', 6372)

('are', 6279)

('these', 5880)

('not', 5785)

('br', 5676)

('one', 5343)

('as', 5323)

('she', 4962)

('them', 4923)

('you', 4817)

('pacifier', 4798)

('he', 4765)

('when', 4333)

('her', 4191)

('great', 4089)

('very', 3883)

('like', 3832)

('can', 3810)

('out', 3762)

('be', 3674)

('love', 3673)

('just', 3581)

('would', 3498)

('at', 3408)

('only', 3128)

('pacifiers', 3070)

('use', 3034)

('all', 2968)

('little', 2934)

('our', 2922)

('if', 2916)

('loves', 2894)

('or', 2795)

('had', 2763)

('his', 2726)

('up', 2712)

('son', 2701)

('will', 2644)

('has', 2615)

('daughter', 2485)

('easy', 2471)

('because', 2461)

('get', 2397)

('product', 2386)

('old', 2316)

('from', 2288)

('well', 2240)

('more', 2135)

('also', 2089)

('really', 2075)

('other', 2036)

('mouth', 1985)

('bought', 1970)

('too', 1953)

('good', 1951)

('time', 1945)

('cute', 1885)

('much', 1872)

('than', 1863)

('about', 1860)

('months', 1778)

('no', 1730)

('now', 1726)

('don', 1579)

('there', 1561)

('were', 1545)

('after', 1533)

('do', 1495)

('2', 1482)

('him', 1482)

('put', 1481)

('first', 1471)

('got', 1440)

('me', 1434)

('what', 1432)

('your', 1430)

python哈姆雷特词频统计_人生苦短我用Python——哈姆雷特词频统计相关推荐

  1. python使用复合语句def创建函数对象_【收藏】Python实用技巧-成为Pythoner必经之路...

    前言 本文主要记录 Python 中一些常用技巧,所描述的是告诉你怎么写才是更好?  如果你并不熟悉Python语法,希望你能在下面代码片段中看到Python的简单.优雅; 如果你象我这样,对 Pyt ...

  2. python语言有几种编程方式_零基础自学python语言,有哪几种方法?龟叔说:这套教程带你入门...

    第一我要说的是:你应该先了解python语言的起源,这句话对于自学python的小白来说,本身就是耍流氓. 我们从根源上分析这个问题,这个问题是(从零基础如何自学python编程)? 我的提取关键字: ...

  3. python国内谁的书最好看_强烈建议|转行Python最好看一下这篇文章

    Python现在非常火,语法简单而且功能强大,很多同学都想学Python!最近陆陆续续有很多小伙伴问我,学Python到底应该做什么,从事哪种岗位.下面是我们工作圈里面一些同学的苦恼: 一转行要趁早 ...

  4. python写入excel表格数据绘制图表_(原创)xlsxwriter,python excel 写入数据\图表等操作_图表操作(二)...

    前面分享了使用xlsxwriter创建excel和写入数据GUC:(原创)xlsxwriter,python excel 写入数据\图表等操作_创建.写入(一)​zhuanlan.zhihu.com ...

  5. 老男孩python全栈9期全套视频_[全套视频] 老男孩Python全栈7期:Flask全套组件及原理剖析视频教程,全套视频教程学习资料通过百度云网盘下载...

    目录├─1398 T* * I K, E% T│ ├─01 python fullstack s7day139 课前分享之找一个对标的人.mp4│ ├─02 python fullstack s7da ...

  6. 黑马传智python基础班课程_fb238 17年_传智黑马Python

    fb238 17年_传智黑马Python 文件大小:7.39GB  文件类型:MP4 文件数量:50 --/资源热下载站/Vip教程/编程开发/Python/Fb238 17年_传智黑马Python/ ...

  7. python中字符串类型的encode()方法_第五章 Python字符串常用方法详解

    5.1 Python字符串拼接(包含字符串拼接数字) 在 Python中拼接(连接)字符串很简单,可以直接将两个字符串紧挨着写在一起,具体格式为: strname = "str1" ...

  8. python爬虫有学c的必要吗_可以一边学python爬虫一边学c语言吗?

    数据结2113构和算法并不是一门语言,你可以说有了Python 不用5261学C或者4102C++了,但是不能说不需要学数据结构了,因为它是所有语1653言的基础.看你学Python的用途,如果你学P ...

  9. python 安装包时出现红字_你好啊!Python,初次见面,多多指教

    [人生苦短,我用python]是当下非常流行的一句口头禅.那我们就看下如何在自己的电脑上运行Python程序. 要开始在自己的计算机上使用Python来学习编程,我们需要经过下面的4个步骤. 查看自己 ...

最新文章

  1. Valid Sudoku leetcode java
  2. 《JAVA与模式》之责任链模式
  3. 关于网页导航栏制作的几种方法与常见问题解决(新人向)
  4. 2021年中国地下光缆市场趋势报告、技术动态创新及2027年市场预测
  5. 【重点】Batch Normalization的诅咒
  6. android mdpi对应哪一个屏幕,Android屏幕大小为ldpi,mdpi,hdpi,xhdpi显示? - 例如:ldpi为1024X768像素...
  7. win10便签常驻桌面_小巧免费的桌面便签工具分享
  8. SN号获取及显示不全的问题
  9. 广州坐标系转换大地2000_如何将百度坐标转换为国家2000坐标系?
  10. 一般图最大匹配问题-带花树开花算法
  11. STM32F1 W5500 TCP Client 回环测试
  12. iPhone 14 电池耗电怎么样?iPhone 14和13比对那个续航好?
  13. 服务器错误数字(代码)对照表
  14. TensorFlow进阶--实现学习率随迭代次数下降
  15. 《数据结构》C语言版 链表的基本操作实现
  16. linux 旋转编码器,基于ARM_Linux的旋转编码器接口与驱动程序的设计
  17. 大众点评开源分布式监控平台 CAT 深度剖析
  18. Ubuntu运行多个命令
  19. java 日历界面_Java实现简单日历小程序 Java图形界面小日历开发
  20. python renamer_Python sys.meta_path方法代码示例

热门文章

  1. 自制操作系统Antz day10——实现shell(上)
  2. 执行git stash pop时的冲突解决
  3. CSS控制文字,超出部分显示省略号
  4. 七星配资沪指低频震荡
  5. Ubuntu的sources.list文件
  6. 数据科学包_Fourth_Chapter
  7. [翻译] Icon and Image Sizes
  8. 【Unity学习笔记】标签(Tag)和层(Layer)
  9. 简单理解二进制的左移和右移(通俗易懂)
  10. 显示前半内容后半内容用省略号_作文写作指导:如何修改作文?