Requests

jieba 分词应用:使用 jieba 分词对一个文本进行分词,将分词结果保存于文件“fc.txt”中,注意结果只保存有效词语,单字不保存。并统计在文章中出现次数最多的前五个词语(一个字的不算词语)。(问题来源:旺财的python作业)

Text

董卓进京后,废立皇帝,残害百姓,荒淫暴虐,激起群臣共愤。一日,司徒王允假借庆寿,约请几位旧臣到他府中叙谈。当他谈到:“社稷旦夕难保”时,情不自禁,掩面哭泣。骁骑校尉曹操自告奋勇,愿行刺董卓。他向王允借来七星宝刀,来到董卓相府,伺机行刺。董卓正在园中小阁休息,他问曹操:“何故来迟?”曹操说因马太瘦弱。董卓便命吕布为曹操挑选一匹好马,吕布出阁而去。
董卓因感困乏,倒身而卧,当他面朝里翻过身去时,曹操急忙拔出宝刀,刚要行刺,不料董卓从铜镜中看见曹操拔刀的身影,急忙回身问操,此时吕布已经牵马来到小阁,曹操急中生智,立即捧刀跪下说:“操近得七宝刀一口,献上恩相。”董卓接过宝刀,很是喜爱,便让操出阁去看马,曹操将马牵出相府,飞身上马,逃出洛阳。
董卓察觉事有蹊跷,知是曹操行刺,便命各地画影图形,捉拿曹操。曹操欲回乡,途经中牟县,被县令陈宫认出。陈宫得知曹操要号召天下诸侯,兴兵共讨董卓,被他的壮志打动,便弃了官职,追随曹操。一天,他们借宿在曹操故友吕伯奢家中,吕伯奢往邻村买酒款待二人。
曹操听到吕家厨房杀猪时的刀声和人语,疑心吕家要加害于他,误杀了吕伯奢全家。为了避免留下后患,在路上又杀死了买酒回来的吕伯奢。陈宫责怪曹操不该“明知而故杀”。曹操却冷笑道:“宁教我负天下人,休教天下人负我。”
陈宫不愿跟随这样不仁不义的人,弃操而去。
曹操逃回陈留之后,尽散家财,招兵买马,准备联络袁绍等人共讨董卓。”

Process

用jieba分词的话要先下载第三方库——jieba,命令符窗口中输入下载命令:pip install jieba -i https://pypi.doubanio.com/simple/,用的是豆瓣源的下载,个人觉得豆瓣是最快的,不接受反驳,谢谢hhh。

Code

import jieba
fR = open('a.txt', 'r', encoding='gb2312')
result={}
sent = fR.read()
sent_list = jieba.lcut(sent)
for i in sent_list:if len(i)<2:sent_list.remove(i)else:temp=result.get(i,"none")if temp=="none":result[i]=1else:result[i]+=1
d_order = sorted(result.items(), key=lambda x: x[1], reverse=True)
for i in range(len(d_order)):if i<5:print(d_order[i][0])
fR.close()

Result

实现高词频的统计以及文件的操作(python_jieba分词)相关推荐

  1. Python实现一篇txt文章的词频统计:文件读取+字典

    上周tensorflow小组作业记录一下,初始代码来自周帜老师我们可爱的gg,我做了一些输出调整,并制作了原理讲解,以下:所见即所得. 操作:把txt文件和.py文件保存在一个文件夹下,接着复制粘贴代 ...

  2. [Paddle领航团python基础课程大作业一]英文词频的统计任务

    英文词频的统计任务 作业内容 方法一: 方法一代码展示 方法二 方法二代码展示 作业内容 统计英语6级试题中所有单词的词频,并返回一个如下样式的字典 {'and':100,'abandon':5} 英 ...

  3. 一个简单的词频分析统计程序

    花了点时间做了一个词频分析统计程序,分析了<失控>英文版(out_of_control)--Kevin_Kelly 的词频.要想流利的阅读英语文章,词汇量应该达到2万左右. 从词频分析来看 ...

  4. MapReduce英语单词频次统计

    MapReduce英语单词频次统计 1.前提准备 1.1 启动hadoop(集群) 2.创建Maven工程 2.1 使用idea创建Maven工程 2.2 导入Hadoop的maven依赖 3.Map ...

  5. 统计java文件中的代码行数

    统计Java代码行数工具类  --  CodeCounterUtil.java 统计指定目录下的java文件中代码行数  --  public static int  getCodeNumFromFo ...

  6. Linux下统计当前文件夹下的文件个数、目录个数

    这篇文章主要介绍了Linux下统计当前文件夹下的文件个数.目录个数,本文使用ls命令配合管理.grep命令实现统计需求,需要的朋友可以参考下 1) 统计当前文件夹下文件的个数 复制代码 代码如下: l ...

  7. 如何创建高质量的TypeScript声明文件(六) - 示例

    2019独角兽企业重金招聘Python工程师标准>>> 转载 如何创建高质量的TypeScript声明文件(六) - 示例 继续上篇文章[如何创建高质量的TypeScript声明文件 ...

  8. Linux统计某文件夹下文件、文件夹的个数

    统计某文件夹下文件的个数 ls -l |grep "^-"|wc -l 统计某文件夹下目录的个数 ls -l |grep "^d"|wc -l 统计文件夹下文件 ...

  9. python遍历指定文件夹的所有文件_python 统计指定文件夹下所有的文件数量,BFS方式...

    python 统计指定文件夹下所有的文件数量 本来一直是有这个需求,只是以前写的是递归的方式处理,感觉对资源的占用不友好,而且python的最大递归深度不超过1000,所以改了一下,这里用广度优先遍历 ...

最新文章

  1. 库(静态库和动态库)
  2. AWS EC2服务器连接登录与创建多账号供多人同时并发使用
  3. struts,ognl,valuestack
  4. LeetCode 多线程 1117. H2O 生成
  5. 力扣——315. 计算右侧小于当前元素的个数
  6. CSS样式:2、超出隐藏控制
  7. (十三)函数指针做函数形参
  8. 一次解决找不到 android.support.v7.XXX 问题
  9. 用request模块爬取拉钩招聘信息
  10. NPOI 读取空Excel 空单元格报错的问题
  11. 结对项目:SudokuGame
  12. 第一次使用梅花雨日历控件
  13. 手工做迷宫_纸盒子废物利用手工自制小迷宫教玩具给幼儿玩(步骤图解)
  14. Tomcat的GC优化实践
  15. 判断平面上两条直线是否相交
  16. 数字信号处理1:绪论
  17. 打砖块游戏代码 java swing
  18. 电子人,还在苦于信息不对称吗?加入我们吧
  19. 计算机网络实验四(以太网数据帧分析)
  20. RHCE(4)给openlab搭建web网站

热门文章

  1. 和利时LE5107_LE5106_自由口协议
  2. arduino 休眠 节能_魔法书3:让 Arduino 慢下来 20倍省电
  3. tomcat html5离线缓存,HTML5离线缓存在tomcat部署可实现图片flash等离线浏览打
  4. 假如今天是生命的最后一天
  5. Java课堂作业:手机销售系统(控制台输出)
  6. 飞腾CPU的汇编指令帮助(持续更新)
  7. 敏捷实施时的五个不当做法
  8. 公历是农历还是阳历怎么区分
  9. vant tabs sticky模式下的bug
  10. 一次性搞定ArcGIS专题图制作流程