(一)搜索引擎的开发一般可分为以下三大部分

1、数据采集层:一般使用爬虫获取互联网的数据,重要的开源项目有Heritrxi

2、数据分析处理层:将从互联网上获取到的数据进行提取归类、分词、语义分析得出索引得内容,等待用户查询使用,重要的开源项目有Lucene

3、视图层:也用户的交互界面,如一个网站的首页

其基本架构可参考下图:

【搜索引擎基础知识1】搜索引擎基本架构相关推荐

  1. 【搜索引擎基础知识1】搜索引擎的技术架构

    转自:http://blog.csdn.net/hguisu/article/details/7955985 1. 搜索引擎的分类 搜索引擎按其工作方式主要可分为三种: 分别是全文搜索引擎(Full ...

  2. 【搜索引擎基础知识3】搜索引擎相关开源项目及网站

    部分内容转自:http://blog.csdn.net/hguisu/article/details/8024799 一. 开源项目 apache lucene是apache下一个著名的开源搜索引擎内 ...

  3. 【搜索引擎基础知识2】网络爬虫的介绍

    转自:http://blog.csdn.net/hguisu/article/details/7949844 通用搜索引擎的处理对象是互联网网页,目前网页数量以百亿计,搜索引擎的网络爬虫能够高效地将海 ...

  4. 【搜索引擎基础知识2】网络爬虫

    部分内容参考<这就是搜索引擎> 通用搜索引擎的处理对象是互联网网页,目前网页数量以百亿计,搜索引擎的网络爬虫能够高效地将海量的网页数据传下载到本地,在本地 形成互联网网页的镜像备份.它是搜 ...

  5. 视频基础知识和直播系统架构

    来源:细说云计算 通常我们所说的视频,是指连续的图象变化每秒超过 24 帧(Frame)画面以上时,根据视觉暂留原理,人眼无法辨别单幅的静态画面,看上去是平滑连续的视觉效果,这样连续的画面叫做视频. ...

  6. 【Android系统蓝牙开发】蓝牙基础知识-蓝牙核心系统架构

    什么是蓝牙? 在开启基于蓝牙Spec v5.2的学习前,我们先了解下什么是蓝牙?蓝牙在我们日常生活中又存在哪些实际应用呢? 蓝牙无线技术是一种短距离无线通信系统,其核心特性主要是以下三点: robus ...

  7. 超详细的Java面试题总结之JavaWeb基础知识总结

    超详细的Java面试题总结之JavaWeb基础知识总结 Java互联网架构师08-29 16:01 打开网易新闻 查看更多精彩图片 Servlet总结: 在Java Web程序中,Servlet主要负 ...

  8. 实训一计算机基础知识,《计算机基础知识与操作技能》实训指导与习题解析

    模块一 计算机基础知识 1 习题解析 1 练习题 4 模块二 Windows XP系统 7 项目一 Windows XP的基本操作 7 任务一 认识Windows XP桌面 7 任务二 设置" ...

  9. 详解服务器异构计算FPGA基础知识

    随着云计算,大数据和人工智能技术应用,单靠CPU已经无法满足各行各业的算力需求.海量数据分析.机器学习和边缘计算等场景需要计算架构多样化,需要不同的处理器架构和GPU,NPU和FPGA等异构计算技术协 ...

最新文章

  1. 快速人体姿态估计--Pose Proposal Networks
  2. 静态页面和动态页面的区别
  3. Vivado的helloword程序:硬件工程部分
  4. 如何创建一个MVC模式的Joomla组件教程(九) 使用数据库下
  5. express bodyparser_nodejs库express是如何接收inbound json请求的
  6. winform通过ListView绑定数据库数据源
  7. 快速排序的实现--代码
  8. 在 VMware ESXi 5.5 和 6.0.x 中支持大于 2 TB 的虚拟机磁盘 (2058287)
  9. 南通大学教务管理微信体验
  10. esx4克隆后的处理工作
  11. C#知识点总结系列:2、C#中IDisposable和IEnumerable、IEnumerator
  12. WebService传输DataSet压缩与解压缩
  13. Linux环境下配置JDK,java环境
  14. DNS解析错误解决办法
  15. pythonwhileelse,关于Python while语句的Else子句
  16. android 手机型号 命名规则,自己整理:各大品牌安卓手机的型号命名规律
  17. 基于Qt的上古神器-Qt Cryptographic Architecture (QCA)加密库介绍
  18. norflash的基本操作
  19. Android 之路20---Java基础14
  20. Maven-settings配置

热门文章

  1. 32行代码AC——L1-027 出租 (20分)(~解题报告~)
  2. 【GIF动画+完整可运行源代码】C++实现 冒泡排序——十大经典排序算法之一
  3. C++编程练习:设计一个银行账户类,包含户名、帐号以及当前余额属性,并且能完成开户、存款、取款和查询余额等行为。
  4. python opencv图片放大 缩小_Python OpenCV之图片缩放的实现(cv2.resize)
  5. 橡皮擦的英语_英语从零开始怎么学
  6. 安装及管理程序(yum搭建本地源,了解rmp命令,查询卸载软件包,编译安装的过程)
  7. Python中的数值类型
  8. linux7切断防火墙,Linux7关闭防火墙
  9. 合泰单片机数码管c语言,合泰单片机定时器数码管显示
  10. matlab引擎函数,Matlab引擎库函数