1、简单应用

代码如下:

 1 #!/usr/bin/env python
 2 # -*- coding: utf-8 -*-
 3 # @File  : jieba.analyse.py
 4 # @Author: 赵路仓
 5 # @Date  : 2020/3/14
 6 # @Desc  : 提取关键字
 7 # @Contact : 398333404@qq.com
 8
 9 import jieba.analyse
10
11
12 text='安全、防止水合物和段塞生成的重要措施之一。因此,针对未来还上油田开发技术,我们预先开展了水深1500米管道式油气水分离器的概念设计。通过该研究,提出适合海洋环境的体积小、重量轻、分离效率高、便于操作和维护的新型油气水三相分离器,使其成为海洋深水油气田开'
13 Key=jieba.analyse.extract_tags(text,topK=3)
14 print(Key)

2、含参使用

 keywords = jieba.analyse.extract_tags(content, topK=5, withWeight=True, allowPOS=()) 
  • 第一个参数:待提取关键词的文本
  • 第二个参数:返回关键词的数量,重要性从高到低排序
  • 第三个参数:是否同时返回每个关键词的权重
  • 第四个参数:词性过滤,为空表示不过滤,若提供则仅返回符合词性要求的关键词

代码如下:

 1 #!/usr/bin/env python
 2 # -*- coding: utf-8 -*-
 3 # @File  : jieba.analyse.py
 4 # @Author: 赵路仓
 5 # @Date  : 2020/3/14
 6 # @Desc  : 提取关键字
 7 # @Contact : 398333404@qq.com
 8
 9 import jieba.analyse
10
11
12 # 字符串前面加u表示使用unicode编码
13 content = u'安全、防止水合物和段塞生成的重要措施之一。因此,针对未来还上油田开发技术,我们预先开展了水深1500米管道式油气水分离器的概念设计。通过该研究,提出适合海洋环境的体积小、重量轻、分离效率高、便于操作和维护的新型油气水三相分离器,使其成为海洋深水油气田开'
14
15 keywords = jieba.analyse.extract_tags(content, topK=5, withWeight=True, allowPOS=())
16 # 访问提取结果
17 for item in keywords:
18     # 分别为关键词和相应的权重
19     print(item[0], item[1])

[Python]利用jieba.analyse进行 关键词 提取相关推荐

  1. python 英文关键词提取_python 利用jieba.analyse进行 关键词提取

    1.简单应用 代码如下: #!/usr/bin/env python # -*- coding: utf-8 -*- # @File : jieba.analyse.py # @Author: 赵路仓 ...

  2. 利用jieba.analyse进行 关键词 提取

    利用jieba.analyse进行 关键词 提取 import jieba.analysetext='2020年5月11日至17日,全市共接报电信诈骗警情80宗.' Key=jieba.analyse ...

  3. Python——利用AC自动机进行关键词提取

    Python--利用AC自动机进行关键词提取 目标:在之前写的文章[Python实现多模匹配--AC自动机]基础上,安装gcc(C编译器),再装ahocorasick ,并完成从文本中提取关键词的任务 ...

  4. python利用jieba(textRank、TFIDF)提取关键字

    from jieba import analyse print("tfidf: ") tfidf = analyse.extract_tags text = "线程是程序 ...

  5. python 利用jieba读取txt文本进行分词后存入新txt

    python 利用jieba读取txt文本进行分词后存入新txt import jieba txt = open("news.txt",encoding='UTF-8').read ...

  6. Python开发练习-对比三种jieba分词的关键词提取结果

    jieba分词是一个很不错的中文分词库,其中关键词提取常用,不同的提取方式结果略有不同,关键词提取优化还是可以做一下的. import os import pathlib import jieba i ...

  7. python 使用jieba.analyse提取句子级的关键字

    安装所需要的库 jieba(pip install jieba) 方法参数解释 jieba.analyse.extract_tags(sentence, topK=5, withWeight=True ...

  8. python分词训练_python练习17:用jieba分词做关键词提取,用matplotlib做可视化

    jieba分词 是一款开源的中文分词包,同时它还带有分析模块,可以用TF-IDF等算法进行关键词分析 jieba 下面的小程序的基本思路是: 通过jieba从 保存好的txt文本中提取关键词,根据关键 ...

  9. python利用jieba实现中文分词

    jieba是一款强大的python第三方中文分词库.目前jieba已经支持四种分词模式: 精确模式:试图将句子最精确地切开,不存在冗余数据,适合文本分析. 全模式:把句子中所有的可以成词的词语都扫描出 ...

最新文章

  1. 互联网时代的云服务器四大功能
  2. 《Unity着色器和屏幕特效开发秘笈》—— 2.1 引言
  3. python3 循环语句
  4. linux命令wc解读
  5. Maven下载+Maven环境变量配置+IntelliJ IDEA配置Maven(详细教程) ,收藏起来吧
  6. matlab如何测两点的角度_【邢不行|量化小讲堂系列01-Python量化入门】如何快速上手使用Python进行金融数据分析...
  7. java 字母金字塔_LeetCode756:金字塔转换矩阵(JAVA题解)
  8. nginx实现https网站设置
  9. ThinkPHP中使用聚合查询去重求和
  10. Arduino:数码管显示原理详解和Proteus仿真实验
  11. 基于opencv和pillow实现人脸识别系统(附demo)
  12. Cisco Packet Tracer 网络系统工程实训大作业【附网络拓扑图】
  13. python中hub_如何用Python实现hub
  14. 佛家经典禅语语录句子
  15. 钱建林出席西古光通成立30周年庆典
  16. 软件设计原则:正确做小事
  17. Django 使用手册
  18. ADC0804的使用
  19. c语言16进制直接文本输出,c语言问题求助:将16进制文本转10进制并输出文本
  20. 变频器服务器维修培训,1、服务器培训.doc

热门文章

  1. 《华中科技大学公开课:哲学导论》 摘抄
  2. 代号“TRUEngine”:GE航空与微软合作推出区块链跟踪飞机零件
  3. IDC行业前景如何?IDC管理系统助力发展
  4. 数据库连接时的时区问题
  5. 【读书笔记】一个没有意义的洞
  6. 2000年 数模国赛 b题 钢管订购与运输
  7. MIT牛人解说数学体系(推荐~)
  8. Net中的AOP系列之构建一个汽车租赁应用
  9. 一些常用软件的静默安装参数(nsis,msi,InstallShield,Inno)
  10. Object类的Cloneable接口没有实现所以需要自己进行相关的实现