python二级第十套答案
46、考生文件夹下,存在2个Python源文件和1个文本文件。其中,2个Python源文件对应2个问题,文本文件“data.txt”中包含一篇从互联网上下载的关于“德国工业4.0战略规划实施建议摘要”的文章。请分别补充2个Python源文件,完成以下功能。

问题1(10分):文件内容清洗。要求:在文件PY301-1.py中补充代码,对文件data.txt的内容进行清理,去除中文标点符号,只保留中文、英文、数字、英文标点符号等字符,将结果输出到文件clean.txt中。示例如下:

德国工业4.0战略计划实施建议摘编机械工业信息研究院战略与规化研究所一德国实施工业…(略)

问题2(10分):提取主题词及其出现频次。要求:在文件PY301-2.py中补充代码,提取clean.txt文件中长度不少于3个字符的词语并统计词频,将词频最高的10个词语作为主题词,并将主题词及其频次输出到屏幕。示例如下:

4.0:10,制造业:9,…(略)

注意:输出格式采用英文冒号和英文逗号,标点符号前后无空格,各词语中间用逗号分隔,最后一个词语后无逗号。

#
# 以下代码仅供参考。
# import jieba
f=open('data.txt','r',encoding='utf-8')
data=f.read()
f.close()
f=open('clean.txt','w')
s=''
x=',。?、‘’“”;:、 )\n(!'
for i in data:if i not in x:s+=i
f.write(s)
f.close()
#
# 以下代码仅供参考。
# import jieba
f=open('clean.txt','r')
data=f.read()
l=jieba.lcut(data)
d = {}
for i in l:if len(i)>=3:d[i] = d.get(i,0)+1
lt = list(d.items())
lt.sort(key = lambda x:x[1],reverse = True)
for i in lt[:9]:print(i[0],':',i[1],end=',',sep='')
print(lt[9][0],':',lt[9][1],sep='')
f.close()

python二级第十套答案相关推荐

  1. python二级第七套答案

    python二级第七套答案 46.某班学生评选一等奖学金,学生的10门主干课成绩存在考生文件夹下文件score.txt中,每行为一个学生的信息,分别记录了学生学号.姓名以及10门课成绩,格式如下: 1 ...

  2. python二级第四套答案

    python二级第四套答案 46.考生文件夹下存在三个Python源文件,分别对应三个问题,请按照文件内说明修改代码,实现以下功能: 二千多年前希腊的天文学家希巴克斯命名十二星座,它们是水瓶座.双鱼座 ...

  3. python二级第三套答案

    python二级第三套答案 46.考生文件夹下存在2个Python源文件和3个文本文件,分别对应两个问题,请按照文件内说明修改代码,实现以下功能: <论语>是儒家学派的经典著作之一,主要记 ...

  4. python二级第十二套答案

    python二级第十二套答案 46.考生文件夹下存在三个Python源文件,分别对应三个问题,请按照文件内说明修改代码,实现以下功能: 法定节假日是根据各国.各名族的风俗习惯或纪念要求,由国家法律统一 ...

  5. Python二级考试题目及答案解析(含刷题软件)

    刷题软件公众h:露露IT [导语] Python是一种面向对象.解释型的高级程序设计语言,广泛应用于数据分析.人工智能.Web开发.游戏开发等领域.Python二级考试是计算机等级考试中的一项重要考试 ...

  6. word2026第十套计算机二级,计算机二级第十套练习真题

    第十套 某出版社的编辑小刘手中有一篇有关财务软件应用的书稿"Word素材.docx",请按下列要求完成书稿编排工作. 1. 在考生文件夹下,将"Word素材.docx&q ...

  7. 计算机二级c语言第82套,计算机等级考试二级C语言模拟试题十套答案

    很好的模拟试题 计算机等级考试二级C语言模拟试题(1)答案: 选择题 1 -10 C D B D D C D C C D 11-20 C A B B C B B A C B 21 -30 D D B ...

  8. python二级考试第一套选择题

    第一套试题 小伙伴们,先做完再看答案哈! 1.关于数据的存储结构,以下选项描述正确的是 A.数据所占的存储空间量 B.数据在计算机中的顺序存储方式 C.数据的逻辑结构在计算机中的表示 D.存储在外存中 ...

  9. python二级考试试题4答案_第4卷讲解Python语言计算机等级考试二级操作题

    1.根据输入正整数n,作为财务数据,输出一个宽度为 20 字符,n右对齐显示,带千位分隔符的效果,使用减号字符"-"填充.如果输入正整数超过 20 位,则按照真实长度输出. 提示代 ...

最新文章

  1. 【翻译】Play框架入门教程一:建立项目
  2. 19.Extjs主页面显示js
  3. do while循环语句_流程控制之循环语句【while循环语句】
  4. php远程文件包含攻击,PHP “is_a()”函数远程文件包含漏洞
  5. 如何单元测试Java的private方法
  6. hashcat 基本使用
  7. 需要友元的原因及使用
  8. pycharm如何设置python版本、设置国内pip镜像、添加第三方类库
  9. 基于GDAL的一个通用的3×3模板函数
  10. XML命名空间和相关类简介
  11. poythoncode-实战2--常用方式for、while、dict、list
  12. Java数据结构笔记1——稀疏数组sparse array
  13. Ubuntu 16.04 LTS 完善解决亮度调整
  14. 通过淘宝司法拍卖购买房子,需要注意些什么?
  15. MOS开关管的选择及原理应用
  16. 【Django】admin.ModelAdmin的源码-20220105
  17. ios本地化_本地化101 iOS与Android
  18. ACM-SIAM离散算法研讨会SODA 2020今日召开
  19. LEARN TO DESIGN THE HEURISTICS FOR VEHICLE ROUTING PROBLEM翻译
  20. Android开发聊天功能

热门文章

  1. b站老是服务器中断,b站崩了是怎么回事 b站崩了原因揭晓 是因为服务器不稳定...
  2. 跨端架构的技术选型 2022
  3. SAP总账汇总表FAGLFLEXT释义
  4. java记事本实现新建、打开、保存、另存为、退出功能
  5. Python矩阵数据类型转换
  6. linux检查不到联网,linux无法联网
  7. EXCEL中如何获得工作表(sheet)的名称
  8. (完美)华为麦芒7 SNE-AL00的usb调试模式在哪里开启的流程
  9. R和Python语言之间相互调
  10. 美联致美医学美容---为您提供美丽定制服务