#输出py:%%writefile walden.py
#打开并读取文件、
file=open(r'C:\Users\Administrator\Desktop\Walden.txt','r')
lines=file.readlines()#要把每行拆成单词
words = []
for line in lines:# 1 print(line.split(" "))tmp_list=line.split(" ")for word in tmp_list:words.append(word)
words#对words中每一个元素出现的个数
#统计结果保存到字典中,字典的key是单词,value是单词初选的次数
word_count = {}
word_set = set(words)
for word in word_set:count_num = words.count(word)word_count[word] = count_num
word_count
#words.count('pages')#对word_count字典进行排序,按照出现的次数(value)进行降序排列
#sorted(word_count.items())
sorted(word_count.items(),key=lambda item: item[1],reverse=True)
#word_count.items()

walden词频统计0相关推荐

  1. 【PTA-python】第7章-1 词频统计 (30 分)--sys.stdin.read()读入到特定字符截至,双重排序条件key=lambda item:(-item[1], item[0])

    第7章-1 词频统计 分析 双重排序条件:字典序,数字降序 题目 解法 自解 参考代码截断到`#`输入的代码 分析 遇到含有回车的无效输入,while循环如何处理.同过input()字符串不断串联起来 ...

  2. 从0开始学习python7:Python中词频统计以及sort的排序用法

    统计单词出现的次数可采用如下代码: counts[word] = counts[word] + 1 当遇到一个新词是,则需要在字典中新建键值对: counts[new_word] = 1 因此,无论是 ...

  3. 软工结对项目之词频统计update

    队友 胡展瑞 031602215 作业页面 GitHub 具体分工 111500206 赵畅:负责WordCount的升级,添加新的命令行参数支持(自定义输入输出文件,权重词频统计,词组统计等所有新功 ...

  4. hive进行词频统计

    统计文件信息: $ /opt/cdh-5.3.6/hadoop-2.5.0/bin/hdfs dfs -text /user/hadoop/wordcount/input/wc.input hadoo ...

  5. Python_note6 组合数据类型+jieba库+文本词频统计

    集合类型和操作 集合元素不可修改,由不可变数据类型组成,元素不可重复 a = {"python",123,("python",123)}使用{}建立集合 b = ...

  6. 软工作业3: 词频统计

    词频统计 一.编译环境 (1)IDE:PyCharm 2018 (2)python版本:python3.6.3(Anaconda3-5.1.0  ) 二.程序分析 (1)读文件到缓冲区(process ...

  7. python 词频统计,分词笔记

    Python的中文分词库有很多,常见的有: jieba(结巴分词) THULAC(清华大学自然语言处理与社会人文计算实验室) pkuseg(北京大学语言计算与机器学习研究组) SnowNLP pynl ...

  8. Hadoop综合大作业补交4次作业:获取全部校园新闻,网络爬虫基础练习,中文词频统计,熟悉常用的Linux操作...

    1.用Hive对爬虫大作业产生的文本文件(或者英文词频统计下载的英文长篇小说)进行词频统计. (1)开启所有的服务,并创建文件夹wwc (2)查看目录下所有文件 (3)把hdfs文件系统中文件夹里的文 ...

  9. 【作业】组合数据类型练习,英文词频统计实例

    1.列表实例:由字符串创建一个作业评分列表,做增删改查询统计遍历操作.例如,查询第一个3分的下标,统计1分的同学有多少个,3分的同学有多少个等. 1 score = list('012332211') ...

最新文章

  1. glibc降级后怎么恢复 linux_Linux(CentOS)GLIBC出错补救方式
  2. Unity 3D:在现有的Android游戏场景中显示AdMob的横幅
  3. 物联网产品:你需要知道的9种智能家居产品
  4. qt label显示文字_Qt官方示例共享内存
  5. Android中怎样在工具类中获取Context对象
  6. [云炬创业基础笔记]第二章创业者测试6
  7. mysql mysql的所有查询语句和聚合函数(整理一下,忘记了可以随时看看)
  8. jQuery clearQueue
  9. WinAPI【远程注入】利用远程线程注入DLLDelphi版
  10. 自学python买什么教材-从入门到进阶必看,51本Python精品书籍免费送!
  11. FISCO BCOS 零知识证明 Fiat-Shamir 实例源码
  12. ctf不允许上传该类型php,d3ctf easyweb题解
  13. 无监督学习——非负矩阵分解(NMF)
  14. 使用ARKit编写测量应用程序代码:交互和测量
  15. [渝粤教育] 西南科技大学 翻译 在线考试复习资料
  16. 力扣LCP3机器人大冒险
  17. 计算机硬盘会计分录,电脑加装固态硬盘如何做分录
  18. 待支付模板html,待支付.html
  19. 解决win10新装系统无法登录微软账户及microsoft store
  20. Kafka KSQL安装

热门文章

  1. 从一年看不完1本书,到半年读完30本,我是怎么做到的?
  2. python项目实战—价格指数的构建
  3. MIMO-MMSE检测几种表达
  4. 问题解决:gitee项目提交失败 master -> master (non-fast-forward)
  5. 简报 | 巴林央行发布新加密货币监管法规
  6. 动物之美计算机教案,一年级美术下册第14课 可爱的动物教案
  7. 糖豆人登录报错解决方案
  8. 自动机器学习AutoML
  9. 代价函数中的1/2m的解释
  10. windows中的PATH变量