###测试

在前面的基础上,myoracle用户下执行检索:

select * from yu_test where contains(name,'重庆')>0

结果:

ID NAME
1 重庆市沙坪坝区
4 重庆市两江新区

####使用chinese_vgram_lexer分析器和chinese_lexer分析器比较

执行如下sql查看不同分析器的分词情况:

SELECT token_text, token_count FROM dr$YU_TEST_INDEX$i
  • 使用chinese_vgram_lexer分析器的分词情况:

TOKEN_TEXT TOKEN_COUNT
上海 2
东新 1
东方 1
两江 1
京市 1
件园 2
北京 1
区 4
区金 1
园 2
国家 1
坝区 1
坪坝 1
城区 1
天府 1
家软 1
市两 1
市国 1
市天 1
市沙 1
市浦 1
市西 1
市青 1
庆市 2
府软 1
成都 2
新区 2
方明 1
无锡 1
明珠 1
桥镇 1
江新 1
江苏 1
沙坪 1
浦东 1
海东 1
海市 1
珠 1
省无 1
羊区 1
苏省 1
西城 1
软件 2
都市 2
重庆 2
金桥 1
锡市 1
镇 1
青羊 1

  • 使用chinese_lexer分析器的分词情况:

TOKEN_TEXT TOKEN_COUNT

上海 1
上海市 1
东方 1
两江 1
北京市 1
区 2
园 2
国家 1
坝区 1
坪坝 1
天府 1
市 1
成都市 2
新区 2
无锡 1
明珠 1
桥镇 1
江 1
江苏省 1
沙坪 1
浦东 1
羊区 1
西城区 1
软件 2
重庆市 2
金桥 1
镇 1
青羊 1

通过对比可以发现:

  • chinese_lexer分析器分词比较严格,按常用词汇进行拆分存储。比如“中国重庆”,只会被拆分为“中国”、“重庆”两个词组。

  • chinese_vgram_lexer分析器则按字为单元来进行拆分,比如“中国重庆”,可以拆分为“中”、“中国“、”国重”、“重庆”、“庆”五个词组。这种方式的好处是能够将所有有可能的词组全部保存进索引表,使得数据不会遗漏。

Oracle全文索引之五 测试相关推荐

  1. Oracle全文索引

    Oracle全文索引 一.设置词法分析器 Oracle实现全文检索,其机制其实很简单.即通过Oracle专利的词法分析器(lexer),将文章中所有的表意单元(Oracle 称为 term)找出来,记 ...

  2. oracle 全文索引 优化,通过案例学调优之--Oracle 全文索引

    通过案例学调优之--Oracle 全文索引 全文检索(oracle text) Oracle Text使Oracle9i具备了强大的文本检索能力和智能化的文本管理能力,Oracle Text 是 Or ...

  3. Oracle 全文索引

    缘由 我们经常需要对表的内容进行模糊查询,在数据量不算很大的情况下,使用起来还是没什么问题,因为不会出现明显的慢查询问题.但是当某些时候,单表数据量很大的时候,查询速度就会有明显的变慢问题.此时,我们 ...

  4. 建立Oracle全文索引

    最近要做搜索,所以学起Oracle全文索引来了. 参考文章:http://www.eygle.com/archives/2005/06/ecieoaoracleeia.html 如何使用Oracle全 ...

  5. oracle 语句 在线测试,2017年Oracle数据库基础测试答案.doc

    . . word完美格式 2017年Oracle数据库基础测试答案 姓名 成绩 一.单项选择题(每题1分,共60分) 列出EMP表中,从事每个工种(JOB)的员工人数 A.select job fro ...

  6. 【原创】oracle的tpc-c测试及方法

    大家好,很高兴来到博客园分享自己的所见所得.希望和大家多多交流,共同进步. 本文重点在于简介使用BenchmarkSQL对oracle进行tpcc的测试步骤,只是一个简单入门的过程. 开源测试工具:B ...

  7. mysql 5.6.4以上版本innodb支持全文索引的测试

    对于mysql 5.6.4以上版本innodb支持全文索引的测试 在mysql官网,innodb引擎在5.6.4版本提供了对全文索引的支持,笔者对此做了测试,发现对中文全文检索的支持依然不理想,但却确 ...

  8. oracle 同步索引,oracle全文索引之同步和优化索引做了什么

    一.同步索引做了什么 我们知道,在数据被修改后,不能被查询到了,直到索引被同步.那么同步索引做了那些工作呢? > insert into t_domain values(3,'this is b ...

  9. timesten mysql_Timesten(TT)和ORACLE执行效率测试

    Timesten(TT)和ORACLE执行效率测试 TT是一个内存数据库,在某些方面执行要比oracle快,因为代码路径和优化器 都没有oracle那么复杂,即使把oracle的数据全部cache到s ...

最新文章

  1. HashMap和HashSet原理及底层实现
  2. PrestaShop 网站后台配置(六)
  3. 日本語のマナーを学びましょう
  4. (一) 自带刷新的列表-LtRecyclerView v2.x版本(LtAdapter)(基本使用)
  5. 将rm -f or -rf 删除命令改为放入回收站,并可通过命令将其撤回
  6. 【Flink】Flink各种UDF简介
  7. testlink(以及服务器)问题定位思路
  8. hashtable允许null键和值吗_HashMap 和 Hashtable 的 6 个区别,最后一个没几个人知道!...
  9. JAVE 视音频转码
  10. keil安装GD32 pack包安装不上 不显示 没有了
  11. 文件上传(FileUpload)
  12. PP助手推大数据智能分发服务
  13. LINUX MPEG4 DVR源代码,还包括一个可以跨平台运行的MPEG4 播放器(需要XVID与SDL开发库包)
  14. iOS RunTime机制----让catagory能够增加属性
  15. flutter 图形验证码
  16. 制作一个小黄鸭转圈跳舞的页面。
  17. 电子邮件发送服务器怎么看钱,验证电子邮件的验证码是发到哪里
  18. Java 书籍阅读计划
  19. Java通过itextpdf生成PDF
  20. 微信小程序钱包支付页面案例

热门文章

  1. C#窗体控件随窗体变大而变大
  2. 【C语言】Pillow(数据溢出问题)
  3. STM32学习——TIM基本定时器
  4. Redis所需内存 超过可用内存怎么办
  5. maven05----maven仓库
  6. git从入门到精通(四)(删除本地标签,删除远程标签)
  7. 同一台主机部署两个比特币钱包以及rpc服务的摘要
  8. C#实现较为实用的SQLhelper
  9. 微信“小程序”开发小指南
  10. 学习ASP.NET之前,先了解它