python 在某段文章中确定一段话中每个词出现的次数,并排序
#-*- coding:utf-8 -*-
import sys
reload(sys)
sys.setdefaultencoding("gbk")
import numpy as np
import jieba
import jieba.analyse
myList = [([""] *2) for i in range(400)]
#如果下面的字符超过400个,就会报错,需要修改
strzk3="""Deep learning models with convolutional and recurrent networks are now ubiquitous and analyze massive amounts of audio, image, video, text and graph data,
with applications in automatic translation, speech-to-text, scene understanding,
ranking user preferences, ad placement, etc. Competing frameworks for building
these networks such as TensorFlow, Chainer, CNTK, Torch/PyTorch, Caffe1/2,
MXNet and Theano, explore different tradeoffs between usability and expressive-
ness, research or production orientation and supported hardware. They operate
on a DAG of computational operators, wrapping high-performance libraries such
as CUDNN for NVIDIA GPUs or NNPACK for various CPUs, and automate
memory allocation, synchronization, distribution."""#为什么这段话中带括号,就报错。
import re
txtp = open("test.html","r").read()
#file1=open('zp','w')
#把strzk1 按照 空格 分为 一个 列表 或 数组 , 然后 再 打印 出来
#用re
#查找资料
# Python的split方法函数可以分割字符串成列表,默认是以空格作为分隔符sep来分割字符串。
listzk=list(jieba.cut(strzk3)) # 为什么jieba分词后,findall 为0
for i in listzk:
#print i
p= listzk.index(i)
myList[p][0]=i
myList[p][1]=len(re.findall(i.decode('unicode_escape'),txtp))
#最昂贵的一个知识点关于结巴:i.decode('unicode_escape')jieba分词后为 unicode ,要转 中文,否则,findall 结果为0 ,
i=0
j=0
#sd=0
for i in range(len(myList)):
for j in range(len(myList[i])):
#if not sd<=len(listzk):
print myList[i][j]
#sd=ds+1
myList.sort(key=lambda x:x[1],reverse=True)
i=0
j=0
for i in range(len(myList)):
for j in range(len(myList[i])):
#if not len(i)==1:
print myList[i][j]
print chr(10)+chr(10)+chr(10)+strzk3
python 在某段文章中确定一段话中每个词出现的次数,并排序相关推荐
- python判断一个或者多个字符串,是否出现在一段话中
python判断一个或者多个字符串,是否出现在一段话中 要判断一段话中是否有几个字符串,只要一个出现就为True,刚开始想用map函数,后来发现也挺麻烦. 查了一些资料,发现用 any比较好 比如 p ...
- 【DL】图像去噪中的patch size是什么(1篇文章链接和1段代码)
图像去噪中的patch size是什么(1篇文章链接和1段代码) 写在前面,因为自己不做图像相关的研究,所以具体内容也不敢妄加总结,自己感觉貌似就是将一整张图分成一块一块的进行处理,每个块之间可以重叠 ...
- 使用Python实现从CAD中选择多段线并提取坐标
使用Python实现从CAD中选择多段线并提取坐标 直接上代码案例 import pythoncom import win32com.clientdef vtpnt(x, y, z=0):return ...
- java不统计冠词_java中输入一段英文文章,请统计出该文章中的冠词数有多少个....
共回答了17个问题采纳率:94.1% package play; import java.util.Scanner; public class Test2 { public static void m ...
- python中输出某段文字_Python如何输出字符串中字符出现的个数
# 输入一段字符串,打印出这个字符串中出现过的字符的出现次数 # 如: # 输入: # abcdabcaba # 打印: # a: 4次 # b: 3次 # d: 1次 # c: 2次 # 注: # ...
- python统计英文文章中单词出现的次数并排序_Python实现的统计文章单词次数功能示例...
本文实例讲述了Python实现的统计文章单词次数功能.分享给大家供大家参考,具体如下: 题目是这样的:你有一个目录,放了你一个月的日记,都是 txt,为了避免分词的问题,假设内容都是英文,请统计出你认 ...
- python中importlib模块安装_Python中标准模块importlib详解
Python中标准模块importlib详解 模块简介 Python提供了importlib包作为标准库的一部分.目的就是提供Python中import语句的实现(以及__import__函数).另外 ...
- python中为什么推荐使用with_Python中的with关键字使用详解
这篇文章主要介绍了Python 中的with关键字使用详解的相关资料,在Python中,with关键字是一个替你管理实现上下文协议对象的好东西,需要的朋友可以参考下 "> 在 Pyth ...
- Python接口自动化测试系列文章汇总
2020 05 20 今天距2021年225天 这是ITester软件测试小栈第125次推文 点击上方蓝字"ITester软件测试小栈"关注我,每周一.三.五早上 07:30准时推 ...
最新文章
- ICML进行时 | 一文看尽获奖论文及Google、Facebook、微软、腾讯的最新科研成果
- 计算机知识指的是什么意思,计算机上面的m+和m-是什么意思
- JMeter运行通过Chrome打开的website
- SunPower携Sunverge纽约合作开发4MWh储能项目
- 虚拟机创建静默快照报错:msg.snapshot.error-QUIESCINGERROR
- python中用来占位_python 占位符
- 第二篇、通过蓝牙连接外设
- 最简单的 SpringCloud 教程 | 第一篇: 服务的注册与发现Eureka(Finchley版本)
- 20050519:把机器拿到鸡兄那里去修了
- 校运会计算机专业口号,校运动会口号(精选80条)
- Web Service随笔
- webpack5学习与实战-(六)-babel-loader解析js文件
- JS常用正则表达式大全
- PHPStudy安全配置
- 用《圣经》做训练数据集,达特茅斯学院完美打造语言风格转换工具
- grpc-go源码剖析二十之grpc客户端帧接收器是如何处理不同的帧的?
- android 仿微信聊天气泡显示图片,怎么实现微信聊天时的气泡图(一)
- Scratch3.0----数据类型
- 保研面试中常见的英语问题有哪些?
- Python课程第十一天_下午_课程笔记(包和模块)
热门文章
- 不用双系统,Mac能直接玩Windows游戏了
- html如何清除context,html5 – 在这个例子中Canvas.Context保存和恢复的目的是什么?...
- iOS / iPadOS 15.7.4发布安全更新 旧版iPhone和ipad无法升级系统解决方法
- await async 执行顺序
- 场景编程集锦 - 懵懂的青春
- 二级生物实验室防护设计基本要求
- 《操作系统》课程心得体会
- hive 插入数据映射到hbase_年薪50万都难招的大数据工程师,凭什么?
- java中修改Excel表格内容
- JavaScript:Form对象