python实现对《白夜行》的词频统计
我用的是jieba这个很好用的中文分词库,大家可以已通过pip安装这个库,最好是通过清华大学镜像站安装,速度快,而腾讯云的镜像站没有这个库。
更换清华镜像源
> pip install pip -U
> pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple
> pip install jieba
import jiebatxt1 = open("D:\\白夜行.txt", "r", encoding="ANSI").read()#文件位置
words = jieba.lcut(txt1)
cnt = {}
for i in words:if len(i) == 1:continueelse:cnt[i] = cnt.get(i, 0) + 1
list1 = list(cnt.items())
list1.sort(key=lambda x: x[1], reverse=True)
for i in range(100):word, num = list1[i]print(i + 1, word, num)
运行结果:
python实现对《白夜行》的词频统计相关推荐
- Python爬虫网易云歌词及词频统计--(周杰伦top50)
本篇博客是利用Python爬虫网易云音乐,并利用jieba分词,对歌词进行分词,然后分析周杰伦top50中最常出现的词语. 我们先尝试获取一首歌的歌词吧,比如等你下课这首歌 上面的id就是等你下课这首 ...
- python 读取TXT 文档进行词频统计
去除停用词 #排除词库 excludes = ['the','and','to','of','i','a','in','it','that','is','you','my','with','not', ...
- 【词频统计】--用python的jieba进行英文文本词频统计
目录 1.基本思路:统计哈利波特小说中词频最高的前20个,去掉一些停用词(如is) 2.停用词(截取部分) 3.代码如下 4.小知识:元组可以用来这样赋值 1.基本思路:统计哈利波特小说中词频最高的前 ...
- 【Python】对英文文本进行词频统计(分词、字典排序、文件读写)
准备知识 1.python读取文件 推荐链接:Python读写txt文本文件 不想细究,直接上手的读取文件参考代码 #默认文件位置为当前python代码的路径(相对路径) #输出文件应为字符串类型 f ...
- 【Python】英文文本分词与词频统计(split()函数、re库)
英文文本分词 1.知识准备 (1)Python中的split()函数的用法 了解split()的基本用法 (2)python多个分割符split字符串 了解re库的部分用法 Python strip( ...
- python统计词频_Python中文分词及词频统计
中文分词 中文分词(Chinese Word Segmentation),将中文语句切割成单独的词组.英文使用空格来分开每个单词的,而中文单独一个汉字跟词有时候完全不是同个含义,因此,中文分词相比英文 ...
- Python中文分词及词频统计
Python中文分词及词频统计 中文分词 中文分词(Chinese Word Segmentation),将中文语句切割成单独的词组.英文使用空格来分开每个单词的,而中文单独一个汉字跟词有时候完全不是 ...
- python 小说词频统计_Python中文分词及词频统计
中文分词 中文分词(Chinese Word Segmentation),将中文语句切割成单独的词组.英文使用空格来分开每个单词的,而中文单独一个汉字跟词有时候完全不是同个含义,因此,中文分词相比英文 ...
- python红楼梦词频统计_Python 红楼梦的字频与词频统计
Python 红楼梦的字频与词频统计 使用jieba分词工具分词,在网上下载了一个停用词表(包括标点符号)去除停用词. 使用wordcloud生成词云. 其实除了停用词,程度词与否定词等也应该去除,但 ...
- python哈姆雷特词频统计_《哈姆雷特与三国演义》词频统计,Hamlet,和
利用python实现对中英文文本的词频统计 英文文本<Hamlet> code1: #CalHamlet.py def getText(): txt = open("hamlet ...
最新文章
- 操作符重载——C/C++学习笔记
- java.lang.OutOfMemoryError: Java heap space解决方法
- 京东618:六年历程步步为营,京东商城的安全保卫战
- Scala类的定义,主/辅构造器,以及方法中的变量定义,单例对象,伴生对象,Apply方法调用,应用程序对象
- [JS] 修改Navigator对象
- python 函数的参数对应
- iOS小白之路...iOS中基础控件的使用
- go 中 = 与:= 区别
- scipy 安装错误及解决
- 数据总线,地址总线,存储容量计算题理解
- 苹果亮度自动调节怎么关闭_Android 亮度自动调节是如何实现的?
- 我来告诉你,一个草根程序员如何进入BAT
- oel 7.0 安装 mysql 5_MySQL 5.7.21 在 OEL6.9 平台上的二进制安装
- 我对Javascript闭包的理解
- 趣头条的开屏广告有什么优势呢?适合哪些企业投放?
- Android之butterknife(懒人库)
- 感性认识:计算机基本工作原理
- python模块-----pyqrcode
- Allegro建立机械符号
- 如何在linux中连接sybase数据库
热门文章
- 面向对象编程之继承、多态、封装、抽象类、接口、包-上
- 7-121 作品评分
- linux下json数据解析,JSON数据解析 - iOS学习笔记_Linux编程_Linux公社-Linux系统门户网站...
- Disruptor学习笔记:基本使用、核心概念和原理
- 星星爱消除,浪漫七夕节—约会表白神器!
- 计算机网络工程师最新教材,网络工程师教程(第4版)全国计算机技术与软件专业(水平)考试教材...
- 银监会发布商业银行个人理财业务投资管理规范细则
- BIM风云录 步步惊心!腾讯布局CIM平台剑指阿里
- tgp英雄联盟无法连接服务器未响应,英雄联盟开局后未响应,lol为什么玩着就未响应了...
- GBase 8s V8.8 SQL 指南:教程-6.4.1(1)