社会化搜索的探索之路——迅雷篇

首发:《 社会化搜索周刊》作者: 马国良

Ailog说 迅雷是成功的社会化模式和社会化搜索模式。但是之前每次和朋友谈迅雷模式的优势的时候,我一直鼓吹迅雷模式如何如何好,却从来没有想过和社会化和社会化搜 索方面联系着想;另一方面也一直在记录和描述社会化和社会化搜索的案例和模式,却没有回头思考其实迅雷也是社会化和社会化搜索的一个特殊案例。现在想想其 实我们可以把迅雷作为目前最成功的社会化和社会化搜索模式案例来研究。
一、迅雷社会化搜索之收藏
迅雷 之所以如此快速的成长,第一得益于优秀的迅雷下载客户端,第二个是因为迅雷自己的资源数据库,迅雷自己的资源数据库实际上是社会化的成果。迅雷客户端的作 用类似社会化搜索引擎网站一般都推出的工具条,但是比工具条优势大,因为工具条的门槛太低了而迅雷客户端一直在同类产品里保持领先优势。社会化搜索引擎网 站的工具条的作用就是方面用户向搜索引擎提交收藏,用户一般是主动提交收藏信息;迅雷客户端的作用也是方面用户向迅雷搜索或者资源数据库提交收藏,但是用 户是连自己也都不知道地提交收藏信息,这就是迅雷产品的高明处。目前用户在使用迅雷客户端的时候下载资源的时候,下载到本地的同时也上传了一份下载信息到 迅雷服务器上,由此来保证通过迅雷搜索到的结果是很丰富的,而且是最新、最热的资源,随着迅雷客户端用户的增加,迅雷服务器可以很轻易把握到互联网用户资 源下载指数。
二、迅雷社会化搜索之资源库
迅雷的资源库很丰富,而且还在不断丰富,只要用户在不断使用迅雷客户端,资源库就会膨胀。迅雷资源库建立的基础是迅雷定向抓取各大资源网站,这点类似社会化搜索引擎很多都建立在元搜索和其他搜索引擎的基础之上(国内元搜索社会化案例: deyeb)。 因此迅雷的资源库由两部分组成:一部分是由机器自动抓取的,另外一部分用户产生的。当用户产生资源数量小的时候,机器搜索抓取起主导;当用户产生资源数量 巨大的时候,虽然可能利用用户产生的资源来满足用户的需求,但是机器搜索抓取的还是需要作为必要的补充,起搜索结果辅助作用。但如果用户产生资源有太多的 无效资源或者垃圾资源呢?怎么样保证用户利用搜索引擎搜索到的就是用户最需求的?这就是涉及到资源筛选、过滤的问题。
三、迅雷社会化搜索之资源筛选
在 丰富资源数据库的同时要保证资源信息的优良性。社会化搜索引擎也面临用户提交信息的过多垃圾的挑战,可能一不小心,社会化搜索引擎就成了“垃圾桶搜索引 擎”。传统的收藏或者书签网站,都不可避免的垃圾信息的干扰,雅虎的收藏也逃不脱成为“垃圾桶”的噩运。国内的365key也是。之前我也一直在考虑用户 筛选机制应该是怎么样的?我之前的文章里也提过:收藏+搜索+dig,结合起来是完美的机制。收藏不能排除垃圾信息进入;搜索决定用户的兴趣、需要,这样 可以避免一部分垃圾信息出现;dig可以对信息筛选,不良信息将被用户剔除出搜索结果。经过dig+搜索的筛选省下来的,与用户不相关的搜索结果被大大减 少。一旦良性用户氛围建立,搜索也变成了wiki搜索,搜索的结果将变得是非常准确的。怎样的搜索才是用户最为喜爱的搜索?迅雷是怎么来筛选资源的呢?用 户喜欢一个搜索引擎,肯定因为用该搜索可以在最短时间内找到最佳信息。这个搜索引擎的搜索机制应该包括机器筛选,人工参与。简单地说就是机器采集的时候设 置采集站点的优先级,这个根据资源热度、网络下载速度等因素来决定,资源热度判断是根据用户用户关注度和下载量。用户对迅雷资源的dig方式就是下载,每 下载一次就相当于为该资源投一票。
四、迅雷社会化搜索之资源聚类
其实目前迅雷作为一个专门的资源搜索 和下载站,好像对社会化搜索的类聚功能需求不是很大,最多做一个相关搜索就可以。迅雷搜索的资源量和范围还是有限的。比如用迅雷搜索“芙蓉姐姐”,社会化 搜索引擎的类聚往往会出现“博客”、“照片”、“北大”等词汇,因为这些类聚词汇可以帮助用户全面了解芙蓉姐姐的全面信息;而用迅雷搜索出来的,无非是一 些恶搞芙蓉姐姐的视频或者图片,这也是用户最需要的,用户在选择用迅雷搜索相比选择社会化搜索搜索范围狭隘些,相对明确的目的决定迅雷和社会化搜索的这点 区别。迅雷不需要类聚,但是类聚对社会化搜索相当重要,类聚甚至可以说是未来智能搜索的一个雏形引导或者启发式,简单智能搜索带有启发式,会利用搜索引擎 去帮助用户寻找最佳答案,在寻找过程中不断引导提示起了关键作用,类聚好坏决定搜索的准确度和所消耗时间量。
四、社会化搜索的其他特征
1.个人搜索
社会化搜索为什么还要个人搜索? 社会化搜索可以是建立在个人搜索基础之上的。这样的模式国外比较成功的有 swicki和 rollyo。 以个人搜索为突破点,自定义搜索页面和搜索结果,也可以指定搜索站点,然后把代码放到个人网站或者个人博客上。因为个人网站或博客的用户群是固定的,同时 自定义搜索页面、搜索结果、指定搜索站点可以满足个人站长和博客为自己网站或博客量身定做一款搜索引擎,访问用户对搜索的增、删、改的建议也将帮助完善个 人个性化搜索,所以个人搜索将被打造一个一个符合需求的搜索。个人搜索的建议将直接影响到整体搜索引擎的搜索结果,可惜目前的swicki还没有推出公共 搜索的服务。Swicki也确实就是wiki化的搜索。提到这点特征,会过来头来再看迅雷,迅雷的社会化机制做得还只是起步,但是有雏形了。我们看到资源 博客和web迅雷首页是相互独立的。Web迅雷其实就类似Swicki的个人搜索,但是这个“个人搜索”只针对个人。通过web迅雷下载资源是对迅雷资源 库的一个更新整理过程,用户在不知情的条件下替迅雷的资源库做wiki编辑工作。因为下载资源可能涉及隐私问题,不然完全可以单独拿出来,每位用户都有一 个资源库和搜索,分享个人下载资源。个人整理的资源库往往是很有价值的,方便自己也方便其他用户,在国内用户主动参与性还不是很高的情况下,web迅雷帮 每位注册用户罗列一个该用户的资源库,用户只需要整理下就可以。单纯的资源博客是没有意义的,结合web迅雷的用户资源库的博客,可能更有价值,这样结合 不就是Swicki的个人搜索吗?
2.圈子
提到了分享,肯定需要 圈子的概念,社会化搜索发展过程中也是慢慢总结普通搜索引擎的不足,慢慢完善的。搜索的分享是非常必要的,前一位搜索相同内容的,对后一位是有指导和帮助意义的。搜索引擎上每天搜索相同事物的用户非常多,我们称这些搜索相同事物的用户为“ 兴趣圈用 户”,而这些用户组成了同一个兴趣圈。兴趣圈第一层意思是把其他用户搜索的相关热点关键词列出来,包含相关搜索和类聚的意思,但是这个是有用户产生的相关 搜索热点。兴趣圈第二层意思是共同兴趣爱好的用户,分享自己的搜索结果。比如李宇春的玉米,肯定有共同的搜索需求和搜索爱好,他们之间的交流也是有必要 的,因为这是他们有共同的兴趣点。社会化搜索的圈子服务是对用户深一层的服务,更好地满足用户需求是社会化搜索的宗旨。迅雷在资源博客来完成圈子的作用, 那是不够的。博客能实现分享,但不能让用户进一步交流。而且搜索的记录痕迹也是可以放入圈子分享的,当然为了保护自己的隐私,可以做关键词屏蔽。圈子的最 终目的,是形成分享的文化氛围,达到交流互动的作用。

最后要说的一点,本文只是在迅雷和社会化搜索的模式上进行讨论。迅雷不是社会化搜索,社会化搜索不是迅雷。因为有相似点,所以放在一起研究下,迅雷或许可以从社会化搜索的模式中寻找到一些优秀的应用,社会化搜索也可以从迅雷的快速发展寻求下自身发展可以借鉴的地方。

社会化搜索的探索之路——迅雷篇相关推荐

  1. 全文搜索!收藏这篇Solr ElasticSearch 长文就可以搞定

    转载自  全文搜索!收藏这篇Solr ElasticSearch 长文就可以搞定 摘自:JaJian`博кē Java后端技术编者说:文章从浅到深,描述了什么是全文搜索,为什么要使用全文搜索,Solr ...

  2. 微服务探索之路03篇-docker私有仓库Harbor搭建+Kubernetes(k8s)部署私有仓库的镜像

    目录: 微服务探索之路01篇.net6.0项目本地win10系统docker到服务器liunx系统docker的贯通 微服务探索之路02篇liunx ubuntu服务器部署k8s(kubernetes ...

  3. 互联网周刊:社会化搜索的回归

    [size=medium][导读]:搜索的最终目的始终是提供最优化的结果,社会化搜索与其说是创新,毋宁说是回归. 搜索引擎一直是互联网最火爆的应用之一,承担了互联网作为一种工具的很大价值.用户不会关心 ...

  4. 如何搜索和阅读一篇论文及鉴别论文好坏

    转自 龚奇源 gongqiyuan@seu.edu.cn https://github.com/qiyuangong/How_to_Search_and_Read_a_Paper/blob/maste ...

  5. 计算机表演赛qq输入法,25届计算机表演赛命题搜索之中国文学篇.doc

    25届计算机表演赛命题搜索答案之中国文学篇 第1题 端午节是纪念我国战国时期的一名爱国诗人的传统节日,这位诗人的 <________> 是<楚辞>的第一篇,是一部具有浪漫主义的 ...

  6. kali2020之快速搜索文件工具——安装篇

    7.1_22:05补充: 据某zz师兄所言 找不到.config原来是因为隐藏文件夹 隐藏文件夹需要修改文件夹名在前面加".",显示隐藏文件/文件夹用ls -al,简写ll 假设文 ...

  7. 搜索官方的一篇相关性文章分享

    议程 概述 检索词 用户的信息需求 网页的自有信息 网页的附属信息 相关性的计算框架 概述 相关性的表象 检索词与被检索网页的相关联程度 相关性的真实意义 用户信息需求与结果网页所提供的信息的重合度 ...

  8. 我的操作系统探索之路----------------进程篇(1)

    开这个类别(我的操作系统探索之路)也是为了自己在以后能来回顾之前的学习历程,有的东西久了也就忘了,写在书上吧,但又不能把书随时给带在身上,所以就只好放博客里了:其次是书上的内容什么的你用一支笔勾画下来 ...

  9. AMiner学术搜索服务全新上线 | “一键”帮你搞定论文综述,带你研读AI相关Topic百篇经典论文

    面对海量的论文文献,无论你是学术新人还是行业大神,你是否想过"谁能帮我找到那篇我最需要的论文呢":想要深入了解学习某个领域知识,你曾否想过"谁能告诉我到底该看哪些论文&q ...

最新文章

  1. 【Windows】清除win10开始菜单中失效打程序标签
  2. Spring Boot——游戏成就系统设计DEMO
  3. TCP短连接产生大量TIME_WAIT导致无法对外建立新TCP连接的原因及解决方法—基础知识篇...
  4. EXPORT_SYMBOL使用
  5. CSS命名规范(建议版)(转)
  6. 认识web网页 了解网页的组成
  7. 阿里云数据库产品专家胡航丽:数据库自动驾驶平台DAS重磅助力数据库领域智能未来...
  8. [翻译]两大因素推动向上比特币价格上涨
  9. 量子计算机张庆瑞讲座报告,燕山大学彭秋明、张庆瑞教授来我校开展学术交流...
  10. 理解包装类 Integer 的底层实现,教你破解所有面试难题!
  11. VirtualBox安装debian无法启动,正确的解决办法
  12. 练习1,从文件到数据库
  13. BZOJ5215[Lydsy2017省队十连测] 商店购物
  14. JUnit5学习之一:基本操作
  15. 快速开发项目的前端框架主要针对后台界面
  16. python进阶day13
  17. php微信摇一摇开发文档,微信摇一摇页面管理
  18. [附源码]java毕业设计哈金院快递驿站管理信息系统
  19. Tushare介绍和入门级实践(1)——使用tushare接口获取沪深300成分股交易日涨跌数据
  20. Ristretto:面向硬件的卷积神经网络逼近

热门文章

  1. Picasa 3很不错!
  2. Win10与子系统Ubuntu 18.04 LTS之间互传文件
  3. Java项目:基于java+ssm社会保险养老系统(计算机毕业设计)
  4. OLTP与OLAP的区别和联系
  5. 原创 OpenCV3编程入门 学习笔记(总)
  6. linux 制作rpm包实例,rpm制作实例 简单打包
  7. uncertain temporal knowledge graph论文解读
  8. 计算机简历相关经验,计算机相关专业学生简历经验谈(8页)-原创力文档
  9. 扣丁音乐(四)——本地音乐加载
  10. [网络流24题][CODEVS1915]分配问题(网络流)