不知道大家有没有这样的经历:突然想起一些以前看过的文章里的一些东西,只记着几个词,想找到原文看看或者要引用他们。为了解决这个问题,我们要一篇一篇的找吗?不,我们使用搜索功能。搜索功能可以帮助我们将文件的文本内容加入我们的搜索范围,这样,当我们搜索这两个我们突然想起来的词时,那原文就会立刻跳出来了。

这样高级的搜索功能有目前有很多中方式实现:windows7(其他版本应该也可以)自带的索引加搜索功能、Google桌面[1]。其他还有如paperport等可以索引pdf,但是与系统集成度不高,用起来感觉很不爽,在这里就不推荐了。不过paperport可是一个著名的软件,大家有兴趣可以了解下它的其他功能。下面主要介绍Windows7继承的索引与搜索功能以及Google桌面这款搜索产品。

一、Window7的索引与搜索功能。

Win7提供了无处不在的搜索框,资源管理器右上角,开始菜单中等。Win7使用的搜索是与Win7的索引功能紧密集合的。Win7的索引工具自动将规定的索引文件夹中的所有文字类文件中的内容提取出来,这个提取的过程使用的是一个称之为提取器(iFilter)的工具。对于不同格式的文件有不同的iFilter,如doc的iFilter、pdf的iFilter等。提取之后形成一个数据库,然后windows再在这个数据库中搜索我们需要的东西。如何使用Win7的索引与搜索,这里就不详细介绍了,因为别人已经写的很清楚了,请参考引文[2,3]。

下面主要说说iFilter。据消息称,Win7已经采用了Foxit公司的iFilter工具Foxit PDF ifilter作为其PDF的提取器[4],但是显然这个Foxit PDF ifilter并不是最新的2.1版本。Foxit PDF ifilter的2.1版本已经推出,而且对于个人用户,它是免费的,那么为什么不使用呢?

首先是下载,先从Foxit官方网站[5]下载这个工具。然后用常规的安装方法安装安装包,这样我们会在控制面板里的索引选项里看到PDF的提取器已经成了Foxit PDF ifilter了,如下图:

确定下面的红色框里选择的是“索引属性和文件内容”。最后重建索引就行了,这样索引完成后就可以正常使用搜索了。

二、Google桌面搜索。

Google桌面下载安装,然后就能直接用了。调出搜索框的快捷键是“Win键+F”。Google自带的pdf提取器我感觉不太好用,主要是不能将很多中文PDF文件的内容很好的提取出来。可以用IfiltershopGdsPlugin这个插件让Google桌面使用Windows系统的提取器(iFilter)。剩下的就不多说了。

另外,还要说一点事情,就是关于搜索关键字的问题。我对几个关键字进行了实验,发现这个关键字使用也有说法的。比如,我搜索“几何特征角点”就可以找到我需要的文章,但是如果我输入“何特征的角点”就找不到任何文章了。再比如“像素点为角”可以找到文章,但“素点为角”就找不到文章了。所以我总结搜索关键字中开头的词(中文)必须为整个词,不能为半个词。这大概是微软构造数据库的方法——对词进行索引。另外,我们可以以单个的字作为关键字进行搜索。

最后还有件事情,就是关于索引系统会对PDF文件的哪些域(标题、主题、关键字(meta)、正文内容等)进行索引?这个我还没有完全确定。但唯一确定的是,它肯定会对文件名和正文进行索引的。之余我们修改了文件内容之后,索引系统会不会重新索引这个文件?那还需要继续研究。

[1] http://moonlab.net/log/desktop-search-pdf.html

[2] http://www.iteeyan.com/2011/01/faster-win7-search/

[3] http://softbbs.pconline.com.cn/10722440.html

[4] http://blog.sina.com.cn/s/blog_597c26770100bp4j.html

[5] http://www.fuxinsoftware.com.cn/pdf/ifilter/

使用Windows7的索引与搜索功能相关推荐

  1. w ndows 高级索引,软媒原创:为Windows7建立索引,搜索文件更给力

    Win7之家( www.win7china.com):软媒原创:为Windows7建立索引,搜索文件更给力 也许你还记得XP时代搜索文件时出现的那只黄色的小狗狗,在Windows7时代,搜索变得更加快 ...

  2. lucene索引搜索_Lucene –快速添加索引和搜索功能

    lucene索引搜索 什么是Lucene? Apache LuceneTM是完全用Java编写的高性能,功能齐全的文本搜索引擎库. 它是一项适用于几乎所有需要全文本搜索的应用程序的技术,尤其是跨平台. ...

  3. Lucene –快速添加索引和搜索功能

    什么是Lucene? Apache LuceneTM是完全用Java编写的高性能,功能齐全的文本搜索引擎库. 它是一项适用于几乎所有需要全文搜索的应用程序的技术,尤其是跨平台的应用程序. Lucene ...

  4. ListView字母快速索引 自动搜索

    最近先来没事,提取一下项目中的一些实用性功能,也算是一种知识总结.希望对自己和需要此功能的朋友有一些帮助 效果图: 字母索引 过滤搜索 功能代码: 自定义一个字母索引的View MyLetterLis ...

  5. 计算机一级考试可以搜索吗,手动找回Windows7搜索功能

    自从上次中了病毒IE,电脑一直有问题.今天发现Win7强大的搜索功能不好用了.在网上google了好长时间,也没有找到解决办法.于是想到了上次除去病毒IE的办法,来修改注册表吧! 下面说一下解决方案: ...

  6. php搜索文件名,window_Windows7内置搜索如何同时搜索文件名与内容,  Win7的搜索功能效果非常强 - phpStudy...

    Windows7内置搜索如何同时搜索文件名与内容 Win7的搜索功能效果非常强大,不但比WinXP快上许多,而且还能即输即显.不过我们在平时使用的时候大家会发现,Win7搜索只能搜索目录中的文件名,却 ...

  7. Hexo集成Algolia实现搜索功能

    2年前搭建的hexo博客好久没有维护了,一看 hexo 以及先前使用 butterfly 主题已经更新好几个版本了,看介绍在速度性能上有了很大的提高,于是打算给 hexo 升个级,整理整理翻翻新.通过 ...

  8. gi克隆github文件_如何构建GitHub文件搜索功能的克隆

    gi克隆github文件 In this article, we will build a project that mimics the lesser known but awesome file ...

  9. 理解Lucene索引与搜索过程中的核心类

    理解索引过程中的核心类 执行简单索引的时候需要用的类有: IndexWriter.Directory.Analyzer.Document.Field 1.IndexWriter IndexWriter ...

最新文章

  1. 【脑电信号分类】脑电信号提取PSD功率谱密度特征
  2. 即使会溢出,也能得到正确的结果
  3. 利用素数表快速寻找 n 以内的所有素数
  4. 这些工具你利用好了吗?
  5. java常用设计模式一:单例模式
  6. 多个虚拟主机服务器,Windows多个虚拟主机服务器
  7. 由浅到深理解ROS(7)-URDF
  8. Nginx通过反向代理实现单端口访问多个服务
  9. 全网最全清理c盘大全
  10. pxe启动找不到服务器,linux – PXE启动 – 在TFTP服务器上找不到内核
  11. win7设置环境变量未生效
  12. 2021-10-26 MSA (测量系统分析)
  13. rax Picture组件
  14. PWM互补脉冲配置,互补输出异常
  15. c#USB接收信息项目的总结
  16. Vue中router-view和子路由的使用方法
  17. 智能电动车无感解锁方案:设备篇
  18. 计算机网络 研究生复试考前最终版
  19. Docker与Ros-kinetic-desktop-full
  20. vuex module总结

热门文章

  1. 【JavaScript 教程】第六章 数组06— slice() :复制数组元素
  2. Maven项目中出现红色波浪线的解决过程
  3. TensorRT详细入门指北,如果你还不了解TensorRT,过来看看吧
  4. 基尼系数 java_决策树的基尼系数计算过程
  5. 基于Egret的VIVO小游戏接入
  6. 【googletrans包】Python谷歌翻译
  7. GetClientRect,ClientToScreen,ClipCursor
  8. docker-composedown卡住
  9. Android分享文件到微信和QQ功能的实现(兼容android 7.0以上的共享文件)
  10. mysql导出一个表_mysql如何导出某个表?