我用的是jieba这个很好用的中文分词库,大家可以已通过pip安装这个库,最好是通过清华大学镜像站安装,速度快,而腾讯云的镜像站没有这个库。
更换清华镜像源

> pip install pip -U
> pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple
> pip install jieba
import jiebatxt1 = open("D:\\白夜行.txt", "r", encoding="ANSI").read()#文件位置
words = jieba.lcut(txt1)
cnt = {}
for i in words:if len(i) == 1:continueelse:cnt[i] = cnt.get(i, 0) + 1
list1 = list(cnt.items())
list1.sort(key=lambda x: x[1], reverse=True)
for i in range(100):word, num = list1[i]print(i + 1, word, num)

运行结果:

python实现对《白夜行》的词频统计相关推荐

  1. Python爬虫网易云歌词及词频统计--(周杰伦top50)

    本篇博客是利用Python爬虫网易云音乐,并利用jieba分词,对歌词进行分词,然后分析周杰伦top50中最常出现的词语. 我们先尝试获取一首歌的歌词吧,比如等你下课这首歌 上面的id就是等你下课这首 ...

  2. python 读取TXT 文档进行词频统计

    去除停用词 #排除词库 excludes = ['the','and','to','of','i','a','in','it','that','is','you','my','with','not', ...

  3. 【词频统计】--用python的jieba进行英文文本词频统计

    目录 1.基本思路:统计哈利波特小说中词频最高的前20个,去掉一些停用词(如is) 2.停用词(截取部分) 3.代码如下 4.小知识:元组可以用来这样赋值 1.基本思路:统计哈利波特小说中词频最高的前 ...

  4. 【Python】对英文文本进行词频统计(分词、字典排序、文件读写)

    准备知识 1.python读取文件 推荐链接:Python读写txt文本文件 不想细究,直接上手的读取文件参考代码 #默认文件位置为当前python代码的路径(相对路径) #输出文件应为字符串类型 f ...

  5. 【Python】英文文本分词与词频统计(split()函数、re库)

    英文文本分词 1.知识准备 (1)Python中的split()函数的用法 了解split()的基本用法 (2)python多个分割符split字符串 了解re库的部分用法 Python strip( ...

  6. python统计词频_Python中文分词及词频统计

    中文分词 中文分词(Chinese Word Segmentation),将中文语句切割成单独的词组.英文使用空格来分开每个单词的,而中文单独一个汉字跟词有时候完全不是同个含义,因此,中文分词相比英文 ...

  7. Python中文分词及词频统计

    Python中文分词及词频统计 中文分词 中文分词(Chinese Word Segmentation),将中文语句切割成单独的词组.英文使用空格来分开每个单词的,而中文单独一个汉字跟词有时候完全不是 ...

  8. python 小说词频统计_Python中文分词及词频统计

    中文分词 中文分词(Chinese Word Segmentation),将中文语句切割成单独的词组.英文使用空格来分开每个单词的,而中文单独一个汉字跟词有时候完全不是同个含义,因此,中文分词相比英文 ...

  9. python红楼梦词频统计_Python 红楼梦的字频与词频统计

    Python 红楼梦的字频与词频统计 使用jieba分词工具分词,在网上下载了一个停用词表(包括标点符号)去除停用词. 使用wordcloud生成词云. 其实除了停用词,程度词与否定词等也应该去除,但 ...

  10. python哈姆雷特词频统计_《哈姆雷特与三国演义》词频统计,Hamlet,和

    利用python实现对中英文文本的词频统计 英文文本<Hamlet> code1: #CalHamlet.py def getText(): txt = open("hamlet ...

最新文章

  1. 操作符重载——C/C++学习笔记
  2. java.lang.OutOfMemoryError: Java heap space解决方法
  3. 京东618:六年历程步步为营,京东商城的安全保卫战
  4. Scala类的定义,主/辅构造器,以及方法中的变量定义,单例对象,伴生对象,Apply方法调用,应用程序对象
  5. [JS] 修改Navigator对象
  6. python 函数的参数对应
  7. iOS小白之路...iOS中基础控件的使用
  8. go 中 = 与:= 区别
  9. scipy 安装错误及解决
  10. 数据总线,地址总线,存储容量计算题理解
  11. 苹果亮度自动调节怎么关闭_Android 亮度自动调节是如何实现的?
  12. 我来告诉你,一个草根程序员如何进入BAT
  13. oel 7.0 安装 mysql 5_MySQL 5.7.21 在 OEL6.9 平台上的二进制安装
  14. 我对Javascript闭包的理解
  15. 趣头条的开屏广告有什么优势呢?适合哪些企业投放?
  16. Android之butterknife(懒人库)
  17. 感性认识:计算机基本工作原理
  18. python模块-----pyqrcode
  19. Allegro建立机械符号
  20. 如何在linux中连接sybase数据库

热门文章

  1. 面向对象编程之继承、多态、封装、抽象类、接口、包-上
  2. 7-121 作品评分
  3. linux下json数据解析,JSON数据解析 - iOS学习笔记_Linux编程_Linux公社-Linux系统门户网站...
  4. Disruptor学习笔记:基本使用、核心概念和原理
  5. 星星爱消除,浪漫七夕节—约会表白神器!
  6. 计算机网络工程师最新教材,网络工程师教程(第4版)全国计算机技术与软件专业(水平)考试教材...
  7. 银监会发布商业银行个人理财业务投资管理规范细则
  8. BIM风云录 步步惊心!腾讯布局CIM平台剑指阿里
  9. tgp英雄联盟无法连接服务器未响应,英雄联盟开局后未响应,lol为什么玩着就未响应了...
  10. GBase 8s V8.8 SQL 指南:教程-6.4.1(1)