1.建索引

trec文档的最后一个</DOC>标记后一定要有换行。

建索引可以选用buildindex.exe,或者indribuildindex.exe。然后要说明的是,索引参数文件里有索引类型一项。<indexType> key(或indri)</indexType>。当用buildindex.exe时,建成的两种类型的索引文件是不一样的,甚至以后的概率表结果也有影响(但我不确定);而用indribuildindex.exe时,两种类型好像没啥区别。

2.训练三个概率表(train probability tables p_z.bin, p_z_d.bin, p_w_z.bin)

plsa的参数文件中,索引路径<index></index>,如果索引是indri类型的,则路径就是索引路径;如果是key类型的,则路径末尾要加上.key。

<doTrain></doTrain>是true。运行后的结果是产生三个二进制文件,分别是 p_z.bin, p_z_d.bin, p_w_z.bin。这三个文件的存储路径是相对路径,具体如何确定,我还不确定。

3.显示概率

只要把plsa参数文件中的<doTrain></doTrain>设为false,运行后即显示概率结果。

转载于:https://www.cnblogs.com/kevinGaoblog/archive/2012/06/08/2541761.html

lemur run PLSA相关推荐

  1. 概率语言模型及其变形系列-PLSA及EM算法

    转载自:http://blog.csdn.net/yangliuy/article/details/8330640 本系列博文介绍常见概率语言模型及其变形模型,主要总结PLSA.LDA及LDA的变形模 ...

  2. LSA,pLSA原理及其代码实现

    一. LSA 1. LSA原理 LSA(latent semantic analysis)潜在语义分析,也被称为 LSI(latent semantic index),是 Scott Deerwest ...

  3. Docker 入门系列(7)- Dockerfile 使用(FROM、RUN、CMD、EXPOSE、ENV、ADD、COPY、ENTRYPOINT、VOLUME、WORKDIR)

    Dockerfile 是一个文本格式的配置文件,用户可以使用 Dockerfile 来快速创建自定义的镜像. 1. 基本结构 Dockerfile 由一行行命令语句组成,并且支持以 # 开头的注释行. ...

  4. docker run 或者 docker restart 启动镜像就自动退出

    执行命令:docker run --name centos8 -d centos /bin/bash,通过docker ps查看正在运行中容器,找不到centos8.通过docker ps -a查看发 ...

  5. Maven Eclipse Run as 命令

    Maven Build Goals: clean 清除编译,compile 编译,test 编译并测试,install 打包并发送到本地仓库,package 只是打成jar包,并不会发送到本地仓库 测 ...

  6. tensorflow学习笔记(四十五):sess.run(tf.global_variables_initializer()) 做了什么?

    当我们训练自己的神经网络的时候,无一例外的就是都会加上一句 sess.run(tf.global_variables_initializer()) ,这行代码的官方解释是 初始化模型的参数.那么,它到 ...

  7. npm run dev 报错:missing script:dev

    错误描述 运行 npm run dev 报错 missing script:dev 原因 查看package.json发现script中并没有dev而是serve.. 所以运行 npm run ser ...

  8. Thread start()方法和run()方法的区别

    Thread start() 方法 ,是一个线程开始的方法 Thread run() 方法 ,就是一个普通的方法,可以理解为main方法里面的一个普通的方法 下面写一个demo 理解下 Thread ...

  9. Kotlin let、with、run、apply、also函数的使用

    let,with,run,apply,also 是内联扩展函数 下面是自己使用的心的如果有错的地方希望给予指正谢谢 这几个主要用来简化操作,使得代码可读性提高 ,下面列举项目中使用效果 1 let 先 ...

最新文章

  1. linux优化网页加载过程,HTML页面加载和解析流程 介绍
  2. oracle 按日输出 取整数,Oracle按日周月分組統計,及next_day()函數詳解
  3. 卡巴斯基授权许可文件_安全许可证的申请流程有哪些?
  4. ACM ICPC 2017 Warmup Contest 2[菜鸡选手的成长]
  5. linux 卸载自带java_卸载linux系统自带JDK,安装自己的jdk
  6. 如何在WPF中调用Winform控件
  7. LINQ:进阶 - LINQ 标准查询操作概述
  8. 这不仅仅是html5的HTML5问题
  9. 设计模式1【续】:动态设定行为
  10. promise原理—一步一步实现一个promise
  11. Excel对话框大全
  12. centos 6.0 rpm 包编译环境的搭建
  13. 【NOIP2017Day1T3】【洛谷P3953】逛公园
  14. java到js的中文无法显示,中文显示位(?)
  15. 制作WIN_XP无人值守光盘
  16. hive 计算周几_HIVE 计算指定日期本周的第一天和最后一天
  17. 单击屏幕亮屏流程分析
  18. US News世界大学综合最新排名前100名
  19. 从信息泄露到权限后台
  20. 需求治理如何实施(二)

热门文章

  1. 星益云聚合收银台系统源码
  2. 实现手机版和电脑端显示不同的广告代码
  3. Moodle: 查询任意数据库
  4. python 内建函数 str() 和 repr() 的区别
  5. 机器学习速成课程 | 练习 | Google Development——编程练习:使用神经网络对手写数字进行分类
  6. Leetcode算法题(C语言)1
  7. Java—List集合详解
  8. Date java 1614619219
  9. ListView控件 1130
  10. 通过火影忍者英雄案例 理解数据类型