python哈姆雷特词频统计_人生苦短我用Python——哈姆雷特词频统计
在本文中利用Python对Hamlet英文词频进行统计,我们解决该问题的基本流程应该如下:
1、读取文件
2、将所有英文字母变成小写
3、根据标点符号,对!'#$%&()*+,-./:;<=>?@[\\]^_‘{|}~等对单词进行分割,形成列表
4、对每个单词进行计数
f1 = open("hamlet.txt",encoding="utf-8")
f2 = f1.read()
text = f2.lower()
str2 = "!'#$%&()*+,-./:;<=>?@[\\]^_‘{|}~"
text=list(text)
number=0
for each in text:
if each in str2:
text[number]=" "
number+=1
text = "".join(text)
word = text.split(" ")
dict1 = dict()
for each in word:
dict1[each] = dict1.get(each,0)+1
items = list(dict1.items())
items.sort(key=lambda x:x[1],reverse=True)
for i in range(100):
print(items[i])
得到结果:
('the', 44680)
('it', 29207)
('and', 26895)
('i', 25662)
('to', 24826)
('a', 20674)
('is', 14564)
('for', 13085)
('my', 12991)
('this', 12519)
('in', 11601)
('of', 10774)
('that', 8605)
('but', 7342)
('t', 7244)
('on', 7098)
('was', 7024)
('we', 6979)
('with', 6935)
('so', 6753)
('baby', 6721)
('s', 6633)
('have', 6547)
('they', 6372)
('are', 6279)
('these', 5880)
('not', 5785)
('br', 5676)
('one', 5343)
('as', 5323)
('she', 4962)
('them', 4923)
('you', 4817)
('pacifier', 4798)
('he', 4765)
('when', 4333)
('her', 4191)
('great', 4089)
('very', 3883)
('like', 3832)
('can', 3810)
('out', 3762)
('be', 3674)
('love', 3673)
('just', 3581)
('would', 3498)
('at', 3408)
('only', 3128)
('pacifiers', 3070)
('use', 3034)
('all', 2968)
('little', 2934)
('our', 2922)
('if', 2916)
('loves', 2894)
('or', 2795)
('had', 2763)
('his', 2726)
('up', 2712)
('son', 2701)
('will', 2644)
('has', 2615)
('daughter', 2485)
('easy', 2471)
('because', 2461)
('get', 2397)
('product', 2386)
('old', 2316)
('from', 2288)
('well', 2240)
('more', 2135)
('also', 2089)
('really', 2075)
('other', 2036)
('mouth', 1985)
('bought', 1970)
('too', 1953)
('good', 1951)
('time', 1945)
('cute', 1885)
('much', 1872)
('than', 1863)
('about', 1860)
('months', 1778)
('no', 1730)
('now', 1726)
('don', 1579)
('there', 1561)
('were', 1545)
('after', 1533)
('do', 1495)
('2', 1482)
('him', 1482)
('put', 1481)
('first', 1471)
('got', 1440)
('me', 1434)
('what', 1432)
('your', 1430)
python哈姆雷特词频统计_人生苦短我用Python——哈姆雷特词频统计相关推荐
- python使用复合语句def创建函数对象_【收藏】Python实用技巧-成为Pythoner必经之路...
前言 本文主要记录 Python 中一些常用技巧,所描述的是告诉你怎么写才是更好? 如果你并不熟悉Python语法,希望你能在下面代码片段中看到Python的简单.优雅; 如果你象我这样,对 Pyt ...
- python语言有几种编程方式_零基础自学python语言,有哪几种方法?龟叔说:这套教程带你入门...
第一我要说的是:你应该先了解python语言的起源,这句话对于自学python的小白来说,本身就是耍流氓. 我们从根源上分析这个问题,这个问题是(从零基础如何自学python编程)? 我的提取关键字: ...
- python国内谁的书最好看_强烈建议|转行Python最好看一下这篇文章
Python现在非常火,语法简单而且功能强大,很多同学都想学Python!最近陆陆续续有很多小伙伴问我,学Python到底应该做什么,从事哪种岗位.下面是我们工作圈里面一些同学的苦恼: 一转行要趁早 ...
- python写入excel表格数据绘制图表_(原创)xlsxwriter,python excel 写入数据\图表等操作_图表操作(二)...
前面分享了使用xlsxwriter创建excel和写入数据GUC:(原创)xlsxwriter,python excel 写入数据\图表等操作_创建.写入(一)zhuanlan.zhihu.com ...
- 老男孩python全栈9期全套视频_[全套视频] 老男孩Python全栈7期:Flask全套组件及原理剖析视频教程,全套视频教程学习资料通过百度云网盘下载...
目录├─1398 T* * I K, E% T│ ├─01 python fullstack s7day139 课前分享之找一个对标的人.mp4│ ├─02 python fullstack s7da ...
- 黑马传智python基础班课程_fb238 17年_传智黑马Python
fb238 17年_传智黑马Python 文件大小:7.39GB 文件类型:MP4 文件数量:50 --/资源热下载站/Vip教程/编程开发/Python/Fb238 17年_传智黑马Python/ ...
- python中字符串类型的encode()方法_第五章 Python字符串常用方法详解
5.1 Python字符串拼接(包含字符串拼接数字) 在 Python中拼接(连接)字符串很简单,可以直接将两个字符串紧挨着写在一起,具体格式为: strname = "str1" ...
- python爬虫有学c的必要吗_可以一边学python爬虫一边学c语言吗?
数据结2113构和算法并不是一门语言,你可以说有了Python 不用5261学C或者4102C++了,但是不能说不需要学数据结构了,因为它是所有语1653言的基础.看你学Python的用途,如果你学P ...
- python 安装包时出现红字_你好啊!Python,初次见面,多多指教
[人生苦短,我用python]是当下非常流行的一句口头禅.那我们就看下如何在自己的电脑上运行Python程序. 要开始在自己的计算机上使用Python来学习编程,我们需要经过下面的4个步骤. 查看自己 ...
最新文章
- Valid Sudoku leetcode java
- 《JAVA与模式》之责任链模式
- 关于网页导航栏制作的几种方法与常见问题解决(新人向)
- 2021年中国地下光缆市场趋势报告、技术动态创新及2027年市场预测
- 【重点】Batch Normalization的诅咒
- android mdpi对应哪一个屏幕,Android屏幕大小为ldpi,mdpi,hdpi,xhdpi显示? - 例如:ldpi为1024X768像素...
- win10便签常驻桌面_小巧免费的桌面便签工具分享
- SN号获取及显示不全的问题
- 广州坐标系转换大地2000_如何将百度坐标转换为国家2000坐标系?
- 一般图最大匹配问题-带花树开花算法
- STM32F1 W5500 TCP Client 回环测试
- iPhone 14 电池耗电怎么样?iPhone 14和13比对那个续航好?
- 服务器错误数字(代码)对照表
- TensorFlow进阶--实现学习率随迭代次数下降
- 《数据结构》C语言版 链表的基本操作实现
- linux 旋转编码器,基于ARM_Linux的旋转编码器接口与驱动程序的设计
- 大众点评开源分布式监控平台 CAT 深度剖析
- Ubuntu运行多个命令
- java 日历界面_Java实现简单日历小程序 Java图形界面小日历开发
- python renamer_Python sys.meta_path方法代码示例