核心代码很简单:

import gensim
from 自己的工具类 import get_seg_content# lda_model 为已经训练好的LDA模型
# content 为一条文本内容
def get_topic(lda_model, content):# get_seg_content() 方法是对文本进行分词content = get_seg_content(content)dictionary = gensim.corpora.Dictionary([content])corpus = dictionary.doc2bow(content)  # 文档转换成bowtopics = lda_model.get_document_topics(corpus)  # 得到新文档的主题分布return topics

lda_Model可以使用这行代码读取:

lda_model = gensim.models.ldamodel.LdaModel.load('../models/lda模型位置')

content是一条文本:

content = '巴拉巴拉。。。'

根据以上的代码,可以构造符合自己项目的代码,比如content换成文本列表什么的

使用LDA模型对新的文档进行分类相关推荐

  1. 多模态大模型时代下的文档图像智能分析与处理

    多模态大模型时代下的文档图像智能分析与处理 0. 前言 1. 人工智能发展历程 1.1 传统机器学习 1.2 深度学习 1.3 多模态大模型时代 2. CCIG 文档图像智能分析与处理论坛 2.1 文 ...

  2. 大模型时代下智能文档处理核心技术大揭秘

    ​强烈推荐一个大神的人工智能的教程:http://www.captainai.net/zhanghan 大模型时代下智能文档处理核心技术大揭秘 前言 一张图全览 文档图像分析与预处理 图像预处理的整体 ...

  3. 百度BCC云解析配置(新旧文档对比) - (文档篇)

    百度BCC云解析配置流程 · 新旧文档对比 百度提示: 如何修改NS服务器地址呢? 查看详情 配置流程: 序号 步骤说明 旧版地址 新版地址 新版 1. 添加域名 查看 查看 .附参考2 下载文档 2 ...

  4. SharePoint 2010新特性文档集

    SharePoint 2010新特性文档集 SharePoint 2010文档管理新加了 document set(文档集)的概念,文档集相当于一个增强版的文件夹,它有自己的homepage, 在其中 ...

  5. 新Word文档借用旧文档的部分样式

    场景 之前的某个文档设置好了各级标题的样式,尤其是多级列表自动更新,在新的Word文档怎么设置不成功,但不能把文档腾到就文档中. 解决方案 1.将有想复用样式的旧Word文档另存为dotm格式,例如下 ...

  6. 关闭word后自动打开新的文档

    解决关闭word后自动打开新的文档 声明:此方法是学的别人的,写出来仅仅为了记录. 步骤:文件 → 选项 → 加载项 → 管理:com加载项 → 转到mysql for excel → 去掉勾勾 → ...

  7. 五大存储模型关系模型 键值存储 文档存储 列式存储 图形数据库

    也可以认为是五大数据库存储模型. 数据库市场需要细分,行式数据库不再满足所有的需求,而有很多需求需要通过本内存数据库和列式数据库解决,列式数据库在数据分析.海量存储.BI这三个领域有自己独到. 1. ...

  8. 在Qt中使用已有模板创建新Word文档

    简 在这篇帖子中我将详细讲述如何在Qt环境下使用已有Word模板文件创建新的文档,并对模板文档内容填充.目前,我只对替换文字和对表格进行操作进行了介绍,如何在文档插入图片未在本文中提及. 述 开发环境 ...

  9. MFC创建新Excel文档并设置其中的格式和字体

    MFC创建新Excel文档并设置其中的格式和字体 转载 生成Excel.obl对象类excel.h 创建对象 [cpp] view plaincopyprint? Range m_ExlRge;    ...

最新文章

  1. leetcode 384. Shuffle an Array | 384. 打乱数组(Fisher-Yates洗牌算法)
  2. 关于”算法工程师/机器学习工程师”的笔试和面试总结
  3. (9)vue.js 指令(1)
  4. 软工网络15个人作业
  5. Codeforces518 D. Ilya and Escalator
  6. 【073】Android 数据存储(SQLite)
  7. CSS RESET —— 浏览器样式重置
  8. 【预测模型】基于粒子群优化宽度学习实现预测matlab代码
  9. PS4在Jetson nano下的配对使用,并用ROS接口来控制
  10. 【Proteus仿真】CD4026秒脉冲0-9循环计数
  11. python中集合的符号_python集合中的操作符有哪些?怎么用?
  12. Linux以百万兆字节显示内存大小
  13. DSP TMS320操作加密芯片源代码
  14. Android获取SystemProperties方法
  15. 在线短视频去水印工具网站
  16. 游戏中的摇杆(手写摇杆)
  17. 保护手机隐私最关键是提高全民信息安全意识
  18. LNK 2001错误
  19. 计算机电路基础重要知识点,计算机电路基础期末复习指导.DOC
  20. 国内外顶级核心期刊TOP20

热门文章

  1. Unreal Engine 4 —— 版本兼容的工作原理以及一些可优化项
  2. 物理渲染-基于物理的光照模型
  3. 光伏农业七大问题不解决 投资者恐“先驱”变“先烈”
  4. Spring Boot - 开发Web应用
  5. Deploy Oracle 10.2.0.5 DataGuard on Red Hat Enterprise Linux 6.4
  6. Control的BeginInvoke和Invoke的区别
  7. 4月第1周回顾:微软向雅虎发最后通牒 头号***伏法
  8. springboot内置浏览器_SpringBoot快速搭建
  9. cadence快捷键修改文件_PCB快捷键设置
  10. Nginx配置文件语法和核心功能配置项详解