互联网1.0时代,网络是人们查阅资料、了解世界的重要窗口,这个时期人与信息的关系是单向的,信息如一本本静态的电子化书本需要用户触及后再阅览获取;

互联网2.0时代,互联网开始成为人们获取价值信息和社交不可或缺的重要工具,人与信息的关系开始有了双向的交互,信息与人共同编织、丰富着这张时代大网。

随着推荐技术成熟以及信息流业务急速扩张,用户与内容的交互模式逐渐从“人找内容-搜索”向“内容找人-推荐”迁移,并且这种趋势仍在扩大它的外延。搜索作为人与内容信息交互的一种重要方式,它的作用并没有削弱,用户在推荐场景的沉浸消费反而会激发出新的搜索需求。

从本质上看,搜索与推荐关注的交汇点都是交互的核心——用户兴趣,因此如何在当前信息分发场景中更好满足用户兴趣是一个重要命题。而浏览器是用户在互联网2.0时代与世界交互信息的重要入口,也是展示搜索与推荐技术精进的绝佳观察点。

浏览器作为一款综合性APP,承载了搜索、信息流推荐、小说等多种用户消费信息的场景。这些场景都有大量的内容理解、内容生成方面的AI需求。不同的场景都有各自的特点,比如搜索的Query意图分类、信息流的内容推荐、小说的内容分类等。

这些特点也让浏览器成为全面观察AI技术在自然语言语义理解方向发展很好的窗口,跟随推荐技术的发展脉络,我们发现腾讯旗下的QQ浏览器应用月活用户已经超过4亿,俨然成长为浏览器中的超级APP。

在国内,腾讯是较早大规模实践AI推荐技术的厂商之一,旗下的QQ浏览器过去几年来在AI和推荐技术方面经历了几次大规模重构和迭代,现在已经蔚然成森。这几年QQ 浏览器在技术层经历了怎样的厚积?在信息茧房和视频化难题的泥沼中,QQ 浏览器做出了哪些选择?其实战经历对于浏览器行业来说,还是具有一定的学习和参考价值的,值得我们探讨一下。

信息流“沼泽”中

QQ浏览器面对的选择

在浏览器中,信息流主feed是图文、短视频、小视频混合形态,这也是推荐算法应用的主场景。在这些场景中,浏览器在不断发展的进阶过程中容易遇到这些痛点难题:

1.信息茧房现象。内容和资讯类平台不光要推荐热门的信息内容,也面临解决一些初始信息的冷启动问题,推荐系统如何公正有效的推荐优质内容,使得好内容获得更多的曝光机会,触达更多的人群。

2.面对具有丰富场景的浏览器,其背后的AI研发需求多样复杂,传统的研发模式研发周期长,效率低。比如内容视频化方向,怎么打更好的标签以及做更好的多模态,对视频的理解和多模态的理解如何做到准确把控等。

3.细分场景的多样化与精细化运营的需求,信息流目前发展到了精细化运营的阶段,需要针对多种多样的细分场景进行敏捷优化。

无论是对于用户来说,信息内容的茧房现象带来的一亩三分地的局限“视野”,还是企业面临的形态复杂、内容多样化进阶的AI技术需求等,这些对信息流内容产生影响的挑战都亟需解决,为内容信息的获取和交互还一片轻快的价值体验。

QQ浏览器在面对上述挑战中,选择运用预训练+finetune+AutoML的新范式和多目标多场景联合优化的新深度模型等创新来应对信息流这方面的技术挑战。在腾讯QQ 浏览器举办的AI算法大赛中也可以窥视到多模态技术与超参数对这些浏览器难题的优化,这两个技术也是此次比赛的两条赛道。

比如在视频流的场景中,多模态的技术可以根据视频观看的时间及关注的兴趣及行为让下一个视频更符合、相似目前观看的视频,在语义上的相似可以让用户的体验更好。QQ 浏览器在多模态技术中也做了评价视频语义相似度的问题,可以更精确地评价两个视频的文本区别,为用户不再推荐重复的内容,增强在推荐方面的泛化和兴趣探索的能力,很好地缓解信息茧房的问题。

而超参数技术可以实现多目标融合,也就是在推荐系统中,从刷视频的点击率演进到点击、关注、点赞等同时完成,超参数搜索把以前人工寻参的方式通过网格搜索、非个性化寻参到个性化寻参的方式提升效率。在腾讯QQ浏览器实践过程中可以减少 80% 以上的寻参时间,大大提升了推荐系统的研发效率。

我们知道浏览器在实际的推荐和搜索业务场景中,有异常丰富且持续演化的内容需求,这些庞大的内容数据并没有客观清晰的定义,数据标注也就成为内容算法研发的核心瓶颈,而预训练大模型是解决这一问题的“良药”。

聚焦推荐与搜索:

当浏览器拥抱大模型

预训练大模型也是近两年AI产业中最火的关键词之一。目前比较有名的模型参数量都已经达到万亿级别了,应用场景差异也比较明显。以 OpenAI斥巨资打造的GPT-3为例,它依然是偏 NLP 的模型。在AI大模型的探索上,无论是着眼于提升超大规模AI算力,还是突破学术前沿的角度,本质上都是通过将海量的数据进行预训练、预集成,形成高鲁棒性、低样本量需求的大模型。企业可以根据自身的应用场景,在大模型的基础上进行少量的调参即可完成落地。

而浏览器与大模型的结合,可以将浏览器背后场景的大量内容理解、内容生成中的AI研发所需样本量大大降低,解决标注量与成本这个在浏览器整体业务场景中的核心瓶颈。

QQ浏览器实验室自研了预训练模型“神舟”,这个模型具有百亿参数的训练能力,可以为搜索、推荐、内容理解等多种业务场景起到直接帮助,提升各种自然语言理解算法效果。神舟预训练大模型专注中文自然语言理解,基于预训练的研发模式,可以提前把语言语义中通用的知识学习到预训练模型中,针对下游具体的任务只需要学习任务相关的知识。

通过该模型QQ 浏览器可以微调和满足业务中出现的如评论理解、搜索 Query 推荐等NLP 需求,可以减少 40% 以上所需的标注数据量和相应的研发时间,节省了标注的成本,大大提升了研发的效率。在学术上,也刷新了业界纪录,登顶了中文语言理解测评基准 CLUE 榜单上,成为首个在中文自然语言理解综合评测数据上超过人类水平的预训练模型。

当前神舟大模型已经逐步应用于 QQ 浏览器的搜索、看点资讯、小说等多个场景。随着大模型进一步的迭代和实践,也会深度改造 QQ 浏览器的搜索推荐能力,更好地理解并满足用户表达背后的意图与需求。

大算力时代,机器变得更加理解信息与人,比如在医疗领域的问诊问答、交互对话等实际场景中,大模型可以为语义的理解带来更强的综合效果,而浏览器拥抱大模型,可以更好地沉淀大量的知识,帮助我们更准确地探索AI与机器学习的边界。

在全面数字化迁徙之旅中,我们获得信息的渠道和服务方式也变得越来越便捷智能,对于浏览器行业来说,让人们以优质的体验零门槛获取价值信息是核心诉求,基于这个变化与诉求,QQ 浏览器也将自己的技术品牌升级为QQ 浏览器实验室以更好地聚焦服务用户。

QQ 浏览器实验室:

走向下一代信息交互

对于下一代信息的交互平台,每个人心目中的浏览器都不一样,我们可能会借助元宇宙的技术,通过手势、眼神甚至是意识来操控搜索与推荐,当我们进入沉浸式的新搜索界面时,可能很多的边界都会模糊甚至消失,比如消费和应用的边界,体验与内容的边界,体验与创作的边界等,可能搜索就是一个创作的引子,发现就是探索开始的价值,用户与内容与应用开始层层递进深入,体验和交互的方式全面融合。

无论是哪种未来浏览器,本质上都是搜索网罗信息,精准推荐价值内容,这也是信息技术发展过程中的不变内核。无论未来信息交互的前景怎么变化,前提是技术的不断更迭、突破才能带来体验的重构。

(左起:腾讯副总裁郄小虎、信息平台与服务线CTO徐羽、腾讯副总裁殷宇)

QQ浏览器瞄准长线的数字化趋势价值,成立“QQ浏览器实验室”技术品牌,依靠AI、搜索、大数据、推荐算法的技术研究,提升信息与服务的获取效率,帮助用户零门槛地获取价值信息和服务,革新用户与世界的交互方式。

近些年来,我们发现腾讯越来越重视AI技术能力的构建,也成立了一些技术品牌,比如TEG(技术工程事业群)和CSIG(云与智慧产业事业群),这也是大家心目中离技术最近的品牌。以内容为主的PCG并没有得到足够的关注。随着PCG技术中台的成立,推荐AI中台也成为腾讯技术平台中的核心中台,而QQ浏览器实验室是PCG技术中台的核心支撑中台模块之一,不断为腾讯的推荐业务赋能。

实验室是创新不断诞生并生根发芽的地方,搜狗搜索团队并入后,全网搜索的技术能力与腾讯垂直搜索的能力形成互补,强强联手,这个实验室就聚合了信息交互中最核心的两个技术,可能是我们迈入未来沉浸式搜索交互的第一步。

我们知道,信息技术交互平台的发展不断进阶的目标就是消除鸿沟与隔阂,缩短人与人、人与信息的距离。腾讯信息平台与服务线CTO徐羽也公开表示QQ 浏览器的进阶目标,与之相似都是紧密连接信息与价值,拓宽用户了解世界的眼界。打造互联网未来30年的信息服务工具,做技术的摆渡人,让价值信息更好地网罗服务生活,成为探索未知的下一代超级窗口。

人类历史的长河中,随着信息技术的不断更迭,会越来越注重信息与价值的准确与高效,这也就意味着推荐系统是个无限增长且没有最优解的技术体系,不断进化是它的特点,因此理解用户的能力也会不断地深入,这样持续洞察探索推荐的新趋势和方向,会为用户带来新一代的交互体验与价值赋能。

在AI与信息交互之间:QQ 浏览器的边界探索相关推荐

  1. QQ浏览器信息流云原生应用之路

    背景    QQ 浏览器信息流(QB)推荐架构支撑了 QQ 浏览器.快报主 feeds 场景.浮层等信息流卡片实时推荐的能力,架构上不仅仅要支持多业务.多产品,如 QB .快报.外部合作等,而且需要能 ...

  2. QQ 浏览器(iOS版)崩溃信息研究

    今天碰巧下载了QQ浏览器iOS版本,居然一启动就挂了.后来从手机里面把崩溃信息导出来,仔细研究下,把研究的结果放到网上,与大家分享下. 先把我导出的崩溃信息放出来 Incident Identifie ...

  3. PDF翻译 QQ浏览器 之 AI翻译 离线本地PDF

    1.QQ浏览器 需要翻译的PDF文件用QQ浏览器打开,此时QQ浏览器自带的翻译插件会提醒你 是否翻译 -> 点确认 效果 值得注意的是 该插件调用的腾讯最新的AI 翻译 api  采用了深度学习 ...

  4. QQ浏览器极速内核关闭“您即将提交的信息不安全”提示

    QQ浏览器使用chrome94内核,登陆有些网站会有"您即将提交的信息不安全"提示, 很不方便,查了查帮助最终解决方法如下: 1.开始菜单右键,运行,输入regedit,打开注册表 ...

  5. 夸克、QQ浏览器、简单搜索竞品分析报告

    作者:迷航 (转载已取得作者授权) 一.竞品分析目的 伴随着中国移动互联网的人口红利逐渐到顶,手机浏览器市场的马太效应也越发强烈.在激烈的竞争环境下,仍有新价值要素正在带来新的机会:Z时代.00后用户 ...

  6. QQ浏览器是如何提升搜索相关性的?

    导言 | 搜索相关性主要指衡量Query和Doc的匹配程度,是信息检索的核心基础任务之一,也是商业搜索引擎的体验优劣最朴素的评价维度之一.本文作者刘杰主要介绍QQ浏览器搜索相关性团队在相关性系统及算法 ...

  7. 千亿参数大模型时代,QQ浏览器团队十亿级小模型「摩天」登顶CLUE

    机器之心专栏 作者:Joshua 今年以来,中文 NLP 圈陆续出现了百亿.千亿甚至万亿参数的预训练语言模型,炼大模型再次延续了「暴力美学」.但 QQ 浏览器搜索团队选择构建十亿级别参数量的「小」模型 ...

  8. Part6:客户端和服务端信息交互模型

    一.客户端和服务端信息交互模型 1.[问题]:什么是客户端和服务端? 客户端:可以向服务器发请求,并接收返回的内容进行处理 服务器端:能够接收客户端请求,并且把相关资源信息返回给客户端的 2.[面试题 ...

  9. 百度景鲲:AI交互正在吃掉旧产品边界,触达移动互联网盲区用户 | MEET2020

    郭一璞 整理自 MEET2020 量子位 报道 | 公众号 QbitAI 中国AI助手哪家强?小度助手(DuerOS)领头羊. 在2019年中,小度系AI音箱出货量登顶中国第一.跻身全球前三,而且小度 ...

最新文章

  1. [20161229]linux下使用oclumon命令(rac)
  2. 问题 1676: 算法2-8~2-11:链表的基本操作
  3. Linux Kernel TCP/IP Stack — L1 Layer — Physical NIC
  4. TCP校验和的设计与实现
  5. unity黑白滤镜_unity颜色分级图像滤镜着色器Fast Mobile Color Grading 1.0
  6. 全球及中国一次性造口袋行业发展前景预测及投资价值分析报告2021-2027年版
  7. mysql+文章显示_jsp+mysql文章内容分页显示
  8. MyBatis_Study_003(字段名与属性名称不一致,resultMap)
  9. 以太坊Merkle Patricia Tree(MPT)技术深度解读
  10. atitit 新特性与趋势管理的艺术 v2 s52.docx 1. lang语言系列 java node.js php 2 1.1. Atitit js es5 es6新特性 attilax总结
  11. emplace_back() 和 push_back 的区别:emplace_back效率高,避免push_back使用时所需的额外副本或移动操作
  12. [Swift]添加暂无数据和暂无网络缺省页
  13. 弹性力学经典解法与有限元法的不同特点
  14. linux通讯录软件带头像,Ubuntu联系人应用已支持增强的头像功能
  15. 高校借力泛微,搭建一体化、流程化的​内控管理平台
  16. Spring整合JMS融入工程中-----思路
  17. C++ Test 关于Read Symbols报错的解决方法(适用于Windows 10)
  18. LVSKeepalived—集群、负载均衡、企业高可用详解
  19. 作战仿真中的八个基础的行动模型
  20. Python中的print()函数

热门文章

  1. python遍历文件_python遍历文件
  2. 中国“东数西算”——展望 CCN 无限发展可能
  3. c语言中ntdll.dll,在Win32环境中从ntdll.dll调用Nt函数,C
  4. PHP输出结构类型变量输出,1.PHP基本语法__输出语句、变量、数据类型
  5. ping命令知识详解
  6. 郑州java实习_一个java实习生两周八次的面试经历
  7. dwg文件怎么打开呢?
  8. 三级缓存(不是CPU的概念,而是一种技术上逻辑容错处理方案)
  9. 配置两台物理机的VMware 虚拟机互联互通
  10. 互联互通,区块链的跨链方式