经过近半年的独立研发,搜狗搜索推出了识图搜索功能,即可通过上传图片等方式搜索找到相似群组图片和资料。日前,就这一新功能以及搜索领域热点话题,CSDN记者专访了搜狗公司搜索事业部总经理茹立云。

搜狗公司搜索事业部总经理茹立云

深度调研和数据挖掘用户需求

CSDN记者:请谈谈搜狗做识图搜索功能的初衷是什么?

搜狗公司搜索事业部总经理茹立云:主要基于用户需求的转变,包括两个层面。第一个层面是整个互联网技术都在提升,用户背后的需求一直得不到满足,以前大家搜索主要靠文字,随着时代的进步,媒介使用设备的更新,用户对基于图片、音频、视频等跨媒体搜索需求越来越大。比如说,在搜狗的搜索引擎里面,过去搜一张图片是谁,会有1000万以上的结果。到现在,更多用户不再满足于仅仅看到图片,而想了解图片背后的故事是什么。第二,随着新兴媒体的诞生,像微博,对识图搜索的需求越来越大,用户想知道要加的这个人是不是真实的那个人,包括北京下暴雨网上出现了大量通过PS出来的虚假图片,还有动车事故也有很多虚假的图片,广大网友难辨真伪,所以要增加辨别能力,识图技术就可以辨别事情的真伪。此外,我们也考虑到了搜狗的优势,识图能够更加便捷,搜狗通过跟浏览器结合,用户使用识图越来越方便。

记者:当时开发识图搜索功能的时候搜狗团队内部有没有一些分歧?

茹立云:初期做了比较多的调研,最主要的调研包括三个方面:1.首先是用户的潜在需求到底会有多大,这个我们对相关数据做了挖掘和分析;2.另外就是调研了识图或者图片相关技术,要支撑这么一个识图的产品在技术层面是不是成熟;3.同时现在用户使用的话是不是便捷,如何能够给用户提供更好的体验。通过调研,搜狗发现,一旦发现用户背后的需求非常巨大,做这么一个产品自然而然成为大家的共识。一开始讨论比较多的是用什么样的技术方案研发出来,并且能够很好的做好。但是对于这个功能,我们内部是一直看好的。

记者:与Google推出的识图搜索功能相比如何?

茹立云:搜狗的识图搜索跟Google比较有几个比较重大的创新,我们发现用户在之前的识图需求里面,除了想找到跟这张图片及文化一样的图片之外,很多同组的图片可能也是他感兴趣的,比如说搜一张搞笑的图片,能不能把其他的搞笑的图片搜在一起。搜狗已经不仅仅是基于图像的内容,同时把它文字上的含义,或者说它的语意结合在一起,找到同组合的图片,这是一个创新。第二块儿就是发现用户在使用识图的时候,如果单纯用一种网络服务的形式的话,使用环节会非常不便利,但是如果把它和浏览器很好的紧密结合在一起,使用识图的过程就变得特别简单了,随时随地都可以识图,不用像之前要记住这个网址,拷下来输进去。

技术门槛较高 在微博领域可发挥大作用

记者:采访之前,我也找业界的人咨询了识图搜索技术,据说难度非常大。能否用通俗的语言解释一下技术上的实现方式?

茹立云:搜狗识图主要包括以下几个技术:

首先,图像有效特征的抽取。有一句话叫做“一图胜千言”,图片包含了大量的语意,是用各种各样的颜色、纹理特征表现,怎样能够找到一种有效地特征来描述,对图像压缩、变形、光照的变化都不会受它的影响,这些特征不是搜狗定的,这是里面比较困难的点,就是图像有效特征的抽取。

其次,要抽取这个特征的话怎么把它理想化,一旦理想化之后才可能成为一种索引,否则就没有办法进行索引,后续的效力就没有办法得到保证。搜狗对识图效果的要求非常高,一张图在匹配这块儿要求在10秒以内把结果反馈回来,有效特征的表示是其中一大难点,以及怎么样建立一个索引。

第三,去伪存真。有了大量跟当前图片类似的图片,怎么样从里面能够提取出表示这个图片含义的语意,现在中文互联网的情况比外文互联网的情况复杂很多,比如说很多明星的照片,比如说减肥,都会被网上盗用,怎么能够去伪存真,真正找到这张图对应的是谁。

第四,搜狗做了同主题图片的识别。有别于之前一般的做法,仅仅根据图片的特征和语意,搜狗技术还用到了图片之间的链接关系,怎么样能够把这种链接的关系应用起来,同时提高识图的精度。

记者:我们在图片上可能会存在一些关键字或敏感词,能否对这些关键词进行识别?

茹立云:从技术上来讲,如果不是手写的话,印刷体内容的识别技术是非常成熟的,在90年代末的时候,OCR(Optical Character Recognition光学字符识别)的技术已经非常成熟,里面唯一有困难的是怎么样对图片进行切割。所以OCR的技术本身是非常成熟的,另外搜狗目前还没有应用,但是搜狗这块儿技术有储备,我们跟清华有联合实验室,在90年代末的时候基本上已经可以做到极致了。之前的四库全书的数字化已经做到了这个工作,现在我们会看到微博上有印刷体的图,印刷体的识别现在是非常成熟的技术。

记者:现在微博上需要进行关键字审核,很多人可以先发内容,然后再截一张图下来。这样基于图的内容审核会比较麻烦。

茹立云: 对。这个不在于识图,在监控里面如果有这种需求,已经有非常成熟的技术,基本上国内的高校都有这样的技术。

记者:搜狗的识图搜索技术在业内是什么样的水平?

茹立云:之前我们也做过精度测试,都不逊于当前任何主流的识图产品,另外在信息的及时度上,当天出现的热点,当天能否搜索出来,搜狗可以当×××索出来,但是我们看到其他的同类产品还不支持(到这个及时度)。图像这块儿搜狗在搜索引擎领域有7年的积累,在图像技术上不能说比别人一定强,但是不会比其他家落后,现在大概是这个情况。整个研发到最后推出与创新点结合在一起,速度非常迅速。

任何有道德的公司都不会去触犯保护用户隐私的底线

记者:网上有些图片是有所有权,搜狗识图是怎么处理的?

茹立云:现在对于互联网来讲,图片搜索还没法辨别它是不是有所有权,什么人拥有这个所有权,要通过投诉的渠道。另外,会做一些比较敏感的图片的过滤。

记者:如何看待识图搜索可能会涉及用户个人隐私的问题?

茹立云:据现在的了解,之前也跟国内的图像权威人士做了比较多的交流,基于头像识别的技术,或者人脸识别的技术在开放性方面是不完备的,效果有待于进一步提升。首先在技术上这个门槛还没有跨越;其次就是保护层面,由于技术的不成熟,用人脸识别这种方式的话,本身这种担心是有必要的,但是也并不是非常有必要的事情。作为任何一家有社会责任的公司,推出任何可能涉及隐私产品的时候,一方面要多听一听公众的意见,都不会去侵犯这个底线,隐私是需要保护的。另外一方面需要通过一些技术手段或者其他一些手段能够保护用户的隐私。

记者:但是普通的用户并不是很了解,他们就觉得隐私被侵犯了。

茹立云:现在搜狗的识图搜索技术还不会用人脸识别的技术在里面。

推荐和整合功能是关键

记者:您对目前搜索市场怎么看?尤其是国内,百度在搜索引擎市场基本处于垄断地位,你对搜狗的未来是如何规划的?

茹立云:对搜索引擎市场来讲,其实现在还是处于蓬勃发展的阶段,无论是全球范围内还是中国范围内,市场的潜力还是非常巨大的,尤其是国内市场潜力更加巨大,主要是几方面。

第一,国内的网民还在继续增长,不只在说PC端,无线端也在高速成长。

第二,中国有2000万家中小企业,现在进行互联网营销的有20几万家,规模跟国际上比起来还小很多,整个中国的经济处于高速的发展中,互联网以及电子商务在不断地普及,从企业需要营销的方面来讲未来也会有很大的增长。整个行业处于比较好的发展时期,当然现在也面临一些问题,比如说搜索引擎在互联网上营销的控制可能是其中的一个问题,不能让一些虚假的广告伤害到用户,所以这也是大家尽力去解决的事情。

具体到搜狗来说,里面的机会在于:

第一,我们有跟客户端,浏览器有协同作战的做法,在用户入口方面有优势。

第二,搜狗搜索有比较多的技术创新,像刚才提到的识图搜索,以及前期提到的全搜索技术。用户在使用搜索的时候更加便捷、全面、及时。通过入口的把握以及对产品的创新使得用户越来越多的用搜狗并且喜欢搜狗,这也是过去的一年我们为什么会这么快速成长的原因之一。

另外,未来搜狗会更多的探索浏览器跟搜索结合的搜索模式,现在的搜索还是称作为第二代搜索,那么第三代搜索需要转变一种形式,不再像现在这样简单的关健词搜索,是一种无处不在的搜索,用户要看到一篇新闻的时候,搜索引擎可以告诉你背后是什么,给你推荐相关的内容,从整个互联网发展来讲,第一代是浏览器,第二代是搜索,第三代我们把它称为总推荐,其实是搜索的延伸。搜狗未来希望在这个领域做出比较大的创新性的产品出来,搜索不再像现在靠关健词做的搜索,可以把它称为探索式的搜索,用户看这篇文章背后的需求是什么,我可以告诉你进一步你想做的一些什么事情。

记者:搜狗搜索跟浏览器整合,目前大概的进展是什么样的?

茹立云:目前我们已经在做这个层面的整合,像识图功能通过跟浏览器结合,使得用户使用的便捷和体验有非常好的提升。另外,之前的消息盒子会做视频的推荐,比如说用户看过某一个连续剧,这是一个更新的连续剧,如果有新的出现的话,将第一时间推荐给你,不需要用户自己不停的搜索看看有没有新的,是这种推荐的概念。像音乐搜索,也会搜索页面上是不是存在一些应用,如果你感兴趣的直接就可以在页面上应用,会非常的便捷。未来像电子商务、软件、旅游酒店这块儿都会跟推荐引擎结合在一起。

兴趣为先 扎实基本功最重要

记者:对于一些想进入搜索领域的学生或技术人士,您有什么建议?

茹立云:想跨入搜索领域有很多种方式,本身跟搜索相关的领域要有特别全面的人才,比如说是一个技术人员的话,基本功一定要扎实,比如说编程基本功打好了,才能够做很多比较高深尖的技术。此外,还要选好入门搜索引擎领域的方向,如果本身对互联网的产品非常喜欢,就可以做跟产品相关的工作。如果对网民这块儿有感觉,跟他们联络有感觉,你就可以做产品应用的工作,搜索引擎这个行业出来的人才是多种多样的,关键是你是不是对这个感兴趣,只要感兴趣并且有基础,又为之去努力,做这个行业并不是太难的事情。

记者:技术人员的基本功具体包括哪些部分?

茹立云:这跟计算机科学的基础技术比较相关,比如说像操作系统、编程基础课程等等。你想在里面有更进一步的发展,最好还要会编程语言处理、自然语言处理、技术学识这些计算机领域的专长。


转载于:https://blog.51cto.com/3500841/653370

搜狗搜索事业部总经理:从识图搜索谈未来大势相关推荐

  1. 搜狗桌面事业部总经理杨洪涛: 创新约等于失败

    [CSDN现场报道]2010年12月9日,年度收官技术盛宴SD2.0大会在上海光大会展中心国际大酒店隆重开幕.这是自2007年成功举办首届 以来,由CSDN和<程序员>杂志主办的连续第四届 ...

  2. 搜狗AI事业部张博:不只翻译机,半年内将推数款智能硬件产品

    作者 | Just 毫无疑问,搜狗的大部分 AI 技术已嵌入到搜索和输入法这两大"拳头"产品 . 语音技术最大的一个落地产品当属搜狗输入法,它集成了搜狗的语音输入功能.语音翻译功能 ...

  3. 图片搜索 拍立淘 按图搜索以图搜索 图搜商品 同款搜索商品

    图片搜索 拍立淘 按图搜索 以图搜图 图搜商品 同款搜索 相关资源收集 一.图片搜索介绍 图片搜索主要有以下相关应用: 1.以图搜图 以图搜图,是通过搜索图像文本或者视觉特征,为用户提供互联网上相关图 ...

  4. Android 爆发病毒,华米 OV 均受影响;微信宣战百度搜索;抖音遭约谈 | CSDN极客头条...

    点击上方"CSDN",选择"置顶公众号" 关键时刻,第一时间送达! 「CSDN 极客头条」是从 CSDN 网站延伸至官方微信公众号的特别栏目,专注于一天业界事报 ...

  5. 阿里游戏云事业部总经理马全治:推动阿里巴巴集团游戏生态联盟升级

    2018年8月3日晚,阿里游戏云事业部总经理马全治先生主持了以"聚合生态,云上未来"为主题的阿里巴巴游戏生态晚会的圆桌论坛. 在今年的生态晚会上,阿里云宣布推出全新的游戏云3.0, ...

  6. 前淘宝无线事业部总经理:阿里要做好区块链,除非退市!

    2018年4月1日,CyberMiles的创始人,美国的电商平台发5miles的CEO,前纽交所上市公司兰亭集势CTO,前淘宝无线事业部总经理卢亮,在陀螺财经Value100线上直播间发表演讲. 以下 ...

  7. 移动端网页乱象怎么破?搜狗搜索正在为行业建言

    在平日使用手机浏览网页时,相信大家都遇到过这些情况:不少网页字体.字号.排版混乱,看得人头昏眼花;网上转载过好多次的非原创内容,还要你付费才能下载;正看着网页信息,突然跳出不雅图片,点击关闭按钮直接跳 ...

  8. 中国人工智能学会通讯——搜狗搜索:从搜索到问答 1.1 引言

    1.1 引言 互联网搜索引擎为人们获取信息提供了极大帮助,目前仍是网民获取信息和知识的重要工具.通常使用搜索引擎的典型过程包括三个步骤,首先用户将自己的需求以自然语言查询的方式表达,并提交给搜索引擎: ...

  9. 万字干货 | 滴滴顺风车事业部总经理:忘掉产品,专注用户(附下载)

    PMCAFF(www.pmcaff.com):互联网产品社区,是百度,腾讯,阿里等产品经理的学习交流平台.定期出品深度产品观察,互联产品研究首选. 外包大师(www.waibaodashi.com): ...

最新文章

  1. NLP(3)| seq to seq 模型
  2. php处理html5文件上传代码,HTML5中文件上传的代码
  3. node.js安装模式 的区别_如何使用nodejs写一个接口
  4. Eclipse遇到的错误
  5. Delphi 能不能从Ring 3进入Ring 0
  6. IOS项目中加入Google Admob SDK
  7. 原生ajax请求的五个步骤
  8. 开源程序识别图像像素点_开源浏览器扩展程序,可放大图像
  9. php处理mysql的符号_MySQL数据入库时特殊字符处理
  10. android room_Android Room –待办事项清单应用程序
  11. 保存界面cd的内容图片到本地
  12. 几何画板课件:圆周角与圆心角关系
  13. 惠普台式计算机耳机插口,hp电脑耳机插孔没声音的解决方法
  14. php 如何开发oa系统,如何开发oa系统
  15. 如何解决——打印出的纸张黑底白字?
  16. html5 canvas画彩虹,HTML5 Canvas彩虹连接点动画
  17. 综合评价的基本理论和数据预处理
  18. git学习之Linux安装Git
  19. 中秋节灯谜趣事:古人中秋节…
  20. uil在使用UART通信中的使用

热门文章

  1. C/C++ 数组的初始化
  2. 大道至简:软件工程实践者的思想读后感
  3. Android源码分析:AudioEffect
  4. 工作效率的变速器——沟通
  5. 华为云SNAT 操作(脚本执行)
  6. 【flask入门系列】请求钩子与上下文
  7. PVE 下解决 iKuai 断流、重启问题
  8. guice框架的入门使用
  9. matlab2020a编译环境 MCR 安装步骤(非常实用)
  10. 让页面无懈可击!关于 CSS,你该做好这 20 件事