经典的检索模型如下:

主要分为几个部分:

1. index 部分:

对文档库进行切词、停词、然后进行term 的权重计算,最后形成倒排索引。

2. 用户query检索

用户输入query,然后对这个query进行处理,这里不把query expansion等技术考虑在内,假设query是已经提交的。

同样对query进行停词、分词,计算term权重,然后进行索引遍历,经过过滤和排序最后得到一个doc list返回给用户。

(图片参考百度计算广告课件)

经典检索模型-广告检索类似可参考相关推荐

  1. [转]搜索引擎的文档相关性计算和检索模型(BM25/TF-IDF)

    搜索引擎的检索模型-查询与文档的相关度计算 1. 检索模型概述 搜索结果排序时搜索引擎最核心的部分,很大程度度上决定了搜索引擎的质量好坏及用户满意度.实际搜索结果排序的因子有很多,但最主要的两个因素是 ...

  2. 搜索引擎的检索模型-查询与文档的相关度计算

    1. 检索模型概述 搜索结果排序时搜索引擎最核心的部分,很大程度度上决定了搜索引擎的质量好坏及用户满意度.实际搜索结果排序的因子有很多,但最主要的两个因素是用户查询和网页内容的相关度,以及网页链接情况 ...

  3. 搜索引擎技术 —— 检索模型

    文章目录 内容相似性计算框架 检索模型的评价 检索模型 布尔模型 向量空间模型 文档表示 相似性计算 特征权重计算 TF词频信息计算 IDF逆文档频率计算 TF*IDF框架 概率检索模型 二元独立模型 ...

  4. 这就是搜索引擎——检索模型与搜索结果排序

    布尔模型 布尔模型是检索模型中最简单的一种,理论基础就是集合论. 用户查询一般使用"与或非"这些逻辑连接词,比如用户希望找到与苹果公司相关的信息,可以用如下的逻辑表达式查询:苹果A ...

  5. CIKM 2021 | 图模型在广告检索(Ad Retrieval)中的应用

    ▐ 1. 摘要 图模型能够有效的挖掘数据中的关系信息来增强数据表示,在研究和工业领域都被广泛应用.阿里妈妈搜索广告技术团队于2019年开源了工业界首个支持大规模分布式的深度图学习平台Euler(htt ...

  6. NLP 论文领读 | Seq2Seq一统江湖?谷歌提出全新端到端检索范式DSI,它才是检索模型的未来?

    欢迎关注 NLP 论文领读专栏!快乐研究,当然从研读paper开始--澜舟科技团队注重欢乐的前沿技术探索,希望通过全新专栏和大家共同探索人工智能奥秘.交流NLP「黑科技」,踩在「巨人」肩上触碰星辰!官 ...

  7. 多语言互通:谷歌发布实体检索模型,涵盖超过100种语言和2000万个实体

    来源:新智元 本文约1500字,建议阅读5分钟 实体链接(Entity linking)通常在自然语言理解和知识图谱中起着关键作用.谷歌AI研究人员近期提出了一种新的技术,在这种技术中,可以将特定语言 ...

  8. 多语言互通:谷歌发布实体检索模型,涵盖超百种语言和千万个实体

    实体链接(Entity linking)通常在自然语言理解和知识图谱中起着关键作用.谷歌AI研究人员近期提出了一种新的技术,在这种技术中,可以将特定语言解析为与语言无关的知识库. 如果一段文本中提到一 ...

  9. 《搜索引擎-信息检索实践》7.2.1 分类应用与检索/BM25检索模型

    1.简介 在所有的二元检索模型中,文档会被归为两类,相关文档和不相关文档.我们的任务是确定新来的文档是属于相关文档还是不相关文档. 如何判断相关与否,我们认为新来的文档如果属于相关文档的概率大于不相关 ...

最新文章

  1. layui的checkbox示例
  2. 猪八戒背媳妇用计算机弹出来,猪八戒背媳妇?杭城游泳馆爆笑一幕:浙大学霸果然机智!...
  3. spring事务介绍 1
  4. SecureCRT key登录linux ssh设置
  5. linux中删除特殊文件
  6. PHP如何有效实现多视频同时上传功能
  7. 剖析:计算机专业大一学生如何学习C语言?如何自学C语言?大学C语言学习视频教程谁有?
  8. 88个塑胶模具设计中常用的知识点
  9. 一个图片上传插件,含图片上传后生成预览图片
  10. 学计算机的第一天,计算机人的一天
  11. 服务器向阿里云转移之容器化1.0.1容器建立
  12. html实现信封效果,css信封边框效果实现的2种方法
  13. 第一节 认识python
  14. python并列排名_Oracle并列排名显示
  15. 三方面分析:2020年Java开发就业前景如何?
  16. win7摄像头软件_菜鸟记400旧手机当摄像头,网课直播设备不用愁
  17. 阿里云/华为云云盘挂载步骤
  18. SMT和SMD的区别
  19. 数字KVM切换器,实力铸就品质
  20. SIMD优化之ARM纯汇编开发

热门文章

  1. Windows虚拟WIFI设置器 wifi共享软件
  2. S参数及高速电子连接器特性参数简介
  3. Redis的Key过期问题处理
  4. linux5磁盘配额,RHEL5之磁盘配额
  5. 蓝桥杯 BFS经典题 —— 卡片换位(单走华容道)
  6. 温州大学黄海广博士《深度学习》课程课件(一)
  7. myeclipse2014安装axis2插件
  8. C语言设计调研报告,C语言程序设计第12章调研报告.ppt
  9. 寒武纪发布新款AI训练卡MLU370-X8
  10. oracle里nextval,oracle中的CURRVAL和NEXTVAL用法