Python-123 试题 天龙八部
‘’‘《天龙八部》是著名作家金庸的代表作之一,历时4年创作完成。该作品气势磅礴,人物众多,非常经典。这里给出一个《天龙八部》的网络版本,文件名为“天龙八部-网络版.txt”。
问题1:请编写程序,对这个《天龙八部》文本中出现的汉字和标点符号进行统计,字符与出现次数之间用冒号:分隔,输出保存到“天龙八部-汉字统计.txt”文件中,该文件要求采用 CSV 格式存储,参考格式如下(注意,不统计空格和回车字符):
天:100, 龙:110, 八:109, 部:10
(略)
问题2:请编写程序,对《天龙八部》文本中出现的中文词语进行统计,采用 jieba 库分词,词语与出现次数之间用冒号:分隔,输出保存到“天龙八部-词语统计.txt”文件中。参考格式如下(注意,不统计任何标点符号):
天龙:100, 八部:10
(略)```
import jieba
import redef get_input(input_file):with open(input_file, 'r', encoding='utf-8') as f:f0 = f.read()return f0def process_write(origin, destination):d = dict()ls = []for i in origin:d[i] = d.get(i, 0) + 1items = list(d.items())for i in range(len(items)):word, count = items[i]ls.append("{}:{}".format(word, count))l = ','.join(ls)with open(destination, 'w', encoding='utf-8') as f:f.write(l)def process_1(file):for i in ['\n', ' ']:f1 = file.replace(i, '')return f1def process_2(file):# file = re.sub(',|。|“|”|:|;|?|\n| ', '', file) # 用正则替换掉for i in ",。“”:;? ":file.replace(i, "") # 正常的字符替换file.replace('\n', '')f1 = jieba.lcut(file)return f1def main():input_file = "天龙八部-网络版.txt"f0 = get_input(input_file)output_file1 = "天龙八部-汉字统计.txt"f1 = process_1(f0)process_write(f1, output_file1)output_file2 = "天龙八部-词语统计.txt"f2 = process_2(f0)process_write(f2, output_file2)main()
Python-123 试题 天龙八部相关推荐
- python面试题及答案-5个很好的Python面试题问题答案及分析
本文的主要内容是向大家分享几个Python面试中的T题目,同时给出了答案并对其进行分析,具体如下. 本文的原文是5 Great Python Interview Questions,同时谢谢 @非乌龟 ...
- 在python中、下列代码的输出是什么-python面试题详细总结(附答案)
本篇文章给大家带来的内容是关于python面试题总结(附答案),有一定的参考价值,有需要的朋友可以参考一下,希望对你有所帮助. CPS少儿编程网-Scratch_Python_教程_免费儿童编程学习平 ...
- 2020 年最全 Python 面试题汇总 (四)
@Author:Runsen 文章目录 前言 61.01背包 62.完全背包 63.多重背包 64.多重背包的二进制 65.混合背包 66.Vivio面试真题 67.二维费用的背包问题 68.买卖股票 ...
- python 面试题(3)--- 进制转换
1.二进制.八进制和十六进制的表示方法 代码演示: #二进制 n1 = 0b0101 print(n1)#八进制 n2 = 0o157 print(n2)#十六进制 n3 = 0xF12 print( ...
- 阿里巴巴整理的python_阿里P8大佬整理的2020年最全99道python面试题,文末附答案...
前言: 学习python的优点是什么?python语法非常优雅,简单易学 免费开源 跨平台,可以自由移植 可扩展,可嵌入性强 第三方库丰富 python的应用领域在系统编程中应用广泛,比如说shell ...
- python面试题37道(附答案)看完面试不愁了
1. (1)python下多线程的限制以及多进程中传递参数的方式 python多线程有个全局解释器锁(global interpreter lock),这个锁的意思是任一时间只能有一个线程使用解释器, ...
- 老男孩上海校区Python面试题
python面试题 第一章:python基础 数据类型: 1 字典: 1.1 现有字典 dict={'a':24,'g':52,'i':12,'k':33}请按字典中的 value 值进行排序? 1. ...
- python查询和替换一个文本字符串_【Python】python面试题
一些Python面试题 1. (1)python下多线程的限制以及多进程中传递参数的方式 python多线程有个全局解释器锁(global interpreter lock),这个锁的意思是任一时间只 ...
- python123练习题文库,Python程序设计试题库.doc
Python程序设计试题库.doc .Python程序设计题库一.填空题第一章 基础知识1.Python安装扩展库常用的是_工具.(pip)2.Python标准库math中用来计算平方根的函数是.(s ...
- 史无前例的这个 GitHub 汇总了 300 道 Python 面试题
对于机器学习算法工程师而言,是不可或缺的语言,它的优美与简洁令人无法自拔.那么你了解过Python编程面试题吗?从Python基础到网页爬虫你是否能全方位Hold住?今天,机器之心为读者们推荐一个Gi ...
最新文章
- yum 安装指定版本php,怎样通过yum安装指定版本的php
- 关于从页面中获取用户控件中的其它控件(如DropDownList)事件的方法
- 洛谷 P2048 [NOI2010]超级钢琴(优先队列,RMQ)
- IRasterStatistics Interface
- 洛谷-图的遍历-P2661-信息传递
- 辟谣|bitcoin core0.16.1版本没有删除区块大小限制——带你认识区块大小限制参数...
- Exchange 服务器可支持性矩阵
- c语言数据结构的主函数怎么写,您好,关于数据结构C语言的问题,上次百度知道里面主函数没有发上去? 爱问知识人...
- ServletContext、ServletConfig(FilterConfig)学习笔记
- 通过触发绑定切换下拉框的数据
- 读书笔记-Java完全自学手册
- 写滚动字幕html5源码,[转载]滚动字幕的源代码
- MySQL字符串拼接函数使用
- Android中 Bitmap转JPG PNG
- 计算时间间隔 日历牌上的 周数
- 1022 - 快手短视频广告主接入实践笔记
- 修改broadcom 4322无线网卡ID教程,不再显示第三方无线网卡
- 计算机插补,第三章计算机数控装置的插补原理.doc
- ipa包脱壳、解析、info.plist文件基本信息介绍
- TensorFlow基础(1)特点安装基本用法
热门文章
- hass 安装hacs
- supermicro服务器系统,Supermicro发布新一代1.6GHz系统总线服务器工作...
- 驱动加载INF文件解析(一)
- CronTrigger 配置
- 【Vue】项目环境配置报错:Not Found - GET httpsregistry.npmmirror.com@vue%2fli
- 每天一个Linux命令-19(which,whereis,locate,find区别)
- input、buttom的type为submit的区别
- CFileDialog用法总结
- Linux配置mmcv-full
- 用于X射线束的掠入射聚焦镜