#-*- coding:utf-8 -*-
import sys
reload(sys)
sys.setdefaultencoding("gbk")
import numpy as np

import jieba
import jieba.analyse

myList = [([""] *2) for i in range(400)]

#如果下面的字符超过400个,就会报错,需要修改
strzk3="""Deep learning models with convolutional and recurrent networks are now ubiquitous and analyze massive amounts of audio, image, video, text and graph data,
with applications in automatic translation, speech-to-text, scene understanding,
ranking user preferences, ad placement, etc. Competing frameworks for building
these networks such as TensorFlow, Chainer, CNTK, Torch/PyTorch, Caffe1/2,
MXNet and Theano, explore different tradeoffs between usability and expressive-
ness, research or production orientation and supported hardware. They operate
on a DAG of computational operators, wrapping high-performance libraries such
as CUDNN for NVIDIA GPUs or NNPACK for various CPUs, and automate

memory allocation, synchronization, distribution."""#为什么这段话中带括号,就报错。

import re
txtp = open("test.html","r").read()
#file1=open('zp','w')

#把strzk1 按照 空格 分为  一个  列表 或 数组 , 然后 再  打印 出来

#用re

#查找资料

# Python的split方法函数可以分割字符串成列表,默认是以空格作为分隔符sep来分割字符串。

listzk=list(jieba.cut(strzk3))  # 为什么jieba分词后,findall 为0

for i in listzk:
         
           #print i
       
           p= listzk.index(i)
           myList[p][0]=i
           myList[p][1]=len(re.findall(i.decode('unicode_escape'),txtp))

#最昂贵的一个知识点关于结巴:i.decode('unicode_escape')jieba分词后为 unicode ,要转 中文,否则,findall 结果为0 ,

i=0
j=0
#sd=0
for i in range(len(myList)):  
    for j in range(len(myList[i])):  
      #if not sd<=len(listzk):
        print myList[i][j]
        #sd=ds+1

myList.sort(key=lambda x:x[1],reverse=True)

i=0
j=0
for i in range(len(myList)):  
    for j in range(len(myList[i])):  
      #if not len(i)==1:
        print myList[i][j]

print chr(10)+chr(10)+chr(10)+strzk3

python 在某段文章中确定一段话中每个词出现的次数,并排序相关推荐

  1. python判断一个或者多个字符串,是否出现在一段话中

    python判断一个或者多个字符串,是否出现在一段话中 要判断一段话中是否有几个字符串,只要一个出现就为True,刚开始想用map函数,后来发现也挺麻烦. 查了一些资料,发现用 any比较好 比如 p ...

  2. 【DL】图像去噪中的patch size是什么(1篇文章链接和1段代码)

    图像去噪中的patch size是什么(1篇文章链接和1段代码) 写在前面,因为自己不做图像相关的研究,所以具体内容也不敢妄加总结,自己感觉貌似就是将一整张图分成一块一块的进行处理,每个块之间可以重叠 ...

  3. 使用Python实现从CAD中选择多段线并提取坐标

    使用Python实现从CAD中选择多段线并提取坐标 直接上代码案例 import pythoncom import win32com.clientdef vtpnt(x, y, z=0):return ...

  4. java不统计冠词_java中输入一段英文文章,请统计出该文章中的冠词数有多少个....

    共回答了17个问题采纳率:94.1% package play; import java.util.Scanner; public class Test2 { public static void m ...

  5. python中输出某段文字_Python如何输出字符串中字符出现的个数

    # 输入一段字符串,打印出这个字符串中出现过的字符的出现次数 # 如: # 输入: # abcdabcaba # 打印: # a: 4次 # b: 3次 # d: 1次 # c: 2次 # 注: # ...

  6. python统计英文文章中单词出现的次数并排序_Python实现的统计文章单词次数功能示例...

    本文实例讲述了Python实现的统计文章单词次数功能.分享给大家供大家参考,具体如下: 题目是这样的:你有一个目录,放了你一个月的日记,都是 txt,为了避免分词的问题,假设内容都是英文,请统计出你认 ...

  7. python中importlib模块安装_Python中标准模块importlib详解

    Python中标准模块importlib详解 模块简介 Python提供了importlib包作为标准库的一部分.目的就是提供Python中import语句的实现(以及__import__函数).另外 ...

  8. python中为什么推荐使用with_Python中的with关键字使用详解

    这篇文章主要介绍了Python 中的with关键字使用详解的相关资料,在Python中,with关键字是一个替你管理实现上下文协议对象的好东西,需要的朋友可以参考下 "> 在 Pyth ...

  9. Python接口自动化测试系列文章汇总

    2020 05 20 今天距2021年225天 这是ITester软件测试小栈第125次推文 点击上方蓝字"ITester软件测试小栈"关注我,每周一.三.五早上 07:30准时推 ...

最新文章

  1. ICML进行时 | 一文看尽获奖论文及Google、Facebook、微软、腾讯的最新科研成果
  2. 计算机知识指的是什么意思,计算机上面的m+和m-是什么意思
  3. JMeter运行通过Chrome打开的website
  4. SunPower携Sunverge纽约合作开发4MWh储能项目
  5. 虚拟机创建静默快照报错:msg.snapshot.error-QUIESCINGERROR
  6. python中用来占位_python 占位符
  7. 第二篇、通过蓝牙连接外设
  8. 最简单的 SpringCloud 教程 | 第一篇: 服务的注册与发现Eureka(Finchley版本)
  9. 20050519:把机器拿到鸡兄那里去修了
  10. 校运会计算机专业口号,校运动会口号(精选80条)
  11. Web Service随笔
  12. webpack5学习与实战-(六)-babel-loader解析js文件
  13. JS常用正则表达式大全
  14. PHPStudy安全配置
  15. 用《圣经》做训练数据集,达特茅斯学院完美打造语言风格转换工具
  16. grpc-go源码剖析二十之grpc客户端帧接收器是如何处理不同的帧的?
  17. android 仿微信聊天气泡显示图片,怎么实现微信聊天时的气泡图(一)
  18. Scratch3.0----数据类型
  19. 保研面试中常见的英语问题有哪些?
  20. Python课程第十一天_下午_课程笔记(包和模块)

热门文章

  1. 不用双系统,Mac能直接玩Windows游戏了
  2. html如何清除context,html5 – 在这个例子中Canvas.Context保存和恢复的目的是什么?...
  3. iOS / iPadOS 15.7.4发布安全更新 旧版iPhone和ipad无法升级系统解决方法
  4. await async 执行顺序
  5. 场景编程集锦 - 懵懂的青春
  6. 二级生物实验室防护设计基本要求
  7. 《操作系统》课程心得体会
  8. hive 插入数据映射到hbase_年薪50万都难招的大数据工程师,凭什么?
  9. java中修改Excel表格内容
  10. JavaScript:Form对象