“太极”助力,腾讯如何借大模型降本增效?
更低成本、更优效果,也就是“降本增效”,是所有广告投放追求的目标。广告技术的发展正让“降本增效”越来越具体、越来越可以量化和感知,比如目前互联网广告平台开始以 GMV (成交金额)或 ROI(投入产出比)为营销效果的评估标准。
一次更高效的广告投放,本质上是在合适的场景,让对的广告出现在对的人面前。这离不开广告平台对广告内容和用户群体的深刻理解,并在他们之间达成更准确的匹配。
腾讯广告已经为为此交出了一份答卷:首先,以国际领先的混元AI大模型助力系统深刻理解广告内容,其次以精排大模型提升广告和用户的匹配准确率。此外,这两者的底层都离不开一个业内领先的机器学习平台——太极。
混元 AI 大模型——让系统深度理解广告内容
在近10年的 AI 研究中,工程师和科学家们越来越达成一个共识:越大的模型才能有越高的理解能力。
早期的深度学习模型大约有六千万参数,大约230MB大小,能够把日常物体分成一千个类别;今年火热的绘画 AI “DALL-E2” 则已经有大约 70 亿参数,大约 26GB 大小,输入一句描述句子就能画出一张对应的画,内容准确、视觉效果优美,体现出顶级的文本和图像理解水平。
大模型成为了一个重要的技术演进方向,而这正是广告推荐所需要的核心能力。
广告中既有艺术和创意,也有感情和期待,推荐系统要首先能够理解广告中蕴含的丰富信息,才能做出恰当的推荐。腾讯自研的深度学习大模型——腾讯广告混元 AI 大模型就是广告系统理解内容的核心引擎。
腾讯广告混元 AI 大模型,是一个具有千亿参数的大模型,能够准确理解文字和图像中蕴含的各个层面的信息;它甚至可以把文字、图像、视频作为一个整体来理解,这样不仅对广告的理解更准确,也更符合平台用户对广告的整体感受。
腾讯广告混元 AI 大模型和类似的图文理解模型做过全面的正面对比,目前横扫跨模态检索领域5大权威测评集大满贯、多模态理解领域国际权威榜单VCR上排名第一、CLUE自然语言理解分类榜及CLUE总榜登顶,比大部分模型的图文综合理解能力还要强,是国内当之无愧的多模态、跨模态AI大模型。
混元AI大模型的多模态理解能力,可以有效的加深推荐系统对于广告的理解,从而更精准的将广告推荐给合适的人群,提高用户体验以及广告转化效果。
除了理解已有的广告内容,混元AI大模型还有文字&图像&视频综合生成能力,已经以产品的形式在腾讯广告投放平台提供给每一位广告主,可以极大的提升广告制作的效率。
- “图生视频”功能,可以将静态的图片自动生成不同样式的视频广告;
- “文案助手”功能,可以为广告自动生成更恰当的标题,提升广告的效果;
- “文生视频”功能,未来只需要提供一句广告文案,就可以自动生成与之匹配的视频广告。
精排大模型——让系统更准确匹配广告和人群
在理解广告之后,广告平台还面临一个挑战:把广告展示给合适的人群。模型在解决这一挑战中发挥了核心作用,特别是精排模型。
广告平台上有数以万计的广告主和数以亿计的用户,即便经过广告定向的筛选,匹配一次用户请求的广告仍然可能有成千上万,具体向用户展示哪一个或者哪几个广告才能在尽量符合用户偏好的同时为广告主带来最大的收入,这就是一个极为复杂的多对多匹配问题,需要精细的预估和排序。
腾讯广告精排大模型就是为了解决这个难题而设计的。单模型推理参数达千亿级别,序列化后大小可达数百GB,浮点数计算量最高每秒超过10亿次,在行业位于先进水平。
如此大的模型,最明显的收益是可以利用更多的特征和样本数据,学习得到更强大更精确的模型,进而实现更准确的匹配效果和更高的广告主回报,比如:
- 可以利用更长期、更细致的用户原始行为数据,在合规前提下强化用户洞察,对人群的理解更清晰准确;
- 可以利用更多场景、页面、上下文信息,在跨场景联合建模的同时强化场景差异性表达,降低维护成本,提升用户广告体验;
- 可以利用更长期的样本数据,配合恰当的模型结构和学习算法,平衡不同行业不同稀疏程度广告主投放目标的学习,提升投放效果;
- 可以更好地利用混元AI大模型在广告理解层面得到的丰富信息,实现更好的泛化和广告冷启动。
腾讯广告精排大模型各项算法指标相对于百亿规模小模型有显著提升,全流量上线后,用户可以看到更符合自己兴趣的广告,广告主也可以期待有更高的投放回报。相比以前的小模型算法,腾讯广告精排大模型已累计给广告主带来15%的GMV提升。
精排大模型迄今为止的效果提升还只是一个开始,大模型平台系统和模型算法会持续升级,与此同时,大模型能力也会逐步向召回、粗排等其他环节辐射,不断抬高效果的天花板,为用户和广告主提供更佳的广告体验。
太极机器学习平台——支持TB级大模型顺利运转
腾讯广告平台需要为亿级的用户、海量并不停增加的广告内容提供服务。大模型+高访问压力,对广告平台的承载能力和计算能力都提出了很高的要求。实际上腾讯广告精排大模型的要求尤其苛刻,不仅模型大小是业界顶级,还需要在用户等待页面加载的极短时间内就完成广告匹配。
为了满足这些规模和性能要求,腾讯专门自研搭建了业界一流的太极机器学习平台,可支持10TB级模型训练、TB级模型推理和分钟级模型发布上线,扩展集群规模则可支持更大的模型训练和推理,为实际业务提供大模型的情况下,同时具有很高的性能,达到行业领先水平。
太极机器学习平台采用了分布式参数服务器架构,这是业界第一梯队企业们公认的最佳选择。这种架构的特点是,存储模型参数和执行模型计算,这两种任务在分别的服务器上运行,增加更多服务器就可以支持更大、计算需求更高的模型。太极机器学习平台中的参数服务器系统AngelPS也是腾讯自研的成果,现在不仅可以承载10TB级模型的训练,对多维特征融合、复杂模型结构等更高级、更前瞻性的功能也有优秀支持。
同时太极机器学习平台还具备超大模型在线推理服务的能力。推理计算方面,不仅支持常规的CPU计算,还支持复杂模型的GPU计算加速;存储上,根据在线推理模型大小,自适应选择小模型本地内存加载和大模型AngelPS远程查询的部署策略;在线服务运营上,平台具备多级容灾能力,脏模型秒级回滚能力,以及完备的系统和业务运行实时指标监控和报警系统。
目前,千亿参数、TB规模训练,百 GB 规模预测的腾讯广告精排大模型能短时间内在太极上完成计算、提供可靠的广告匹配结果。不仅如此,为了提供周全的可靠性、紧跟潮流的匹配能力,上百GB规模的腾讯广告精排大模型需要有多个副本同时运行,每天还需要根据当天的真实用户行为持续学习,这些都依赖太极机器平台强大的承载能力和周全的功能。
太极机器学习平台有突出的模型训练硬件加速能力。以混元AI大模型的训练为例,太极的加速方案高于业界其他方案 3.7倍,有效提升了模型的训练效率。
为了让开发者易学、易用,太极机器学习平台也提供了对常见的 TensorFlow 模型和 API 的支持,同时还提供了多种改进,降低 TF 中复杂的性能优化、内存管理带来的困扰。
可以把太极机器学习平台比作一条多车道的高速公路,大模型就像许许多多的重型卡车,可以在高速公路上高速行驶;相比之下,较落后的技术平台就像是乡间的泥泞小道,只通行一辆小车也颠簸、缓慢。两者能提供的服务以及最终带来的用户体验显然也不能同日而语,而当前具备领先地位的太极机器学习平台,毫无疑问能够帮助提供更好的基建体系,助力大模型们高速运行。
打赢大模型关键第一仗,腾讯广告持续深化技术升级
在腾讯太极机器学习平台之上,混元 AI 大模型和腾讯广告精排大模型共同完善优化了广告理解、用户理解、广告和用户匹配的整个流程,提升对广告的理解,提升广告和人群的匹配效率,提升广告主的推荐精准度和转化效率。在“降本增效”的目标指引下,关注并提升 GMV 的腾讯广告平台技术已经打赢了大模型关键战役的第一仗。未来腾讯广告也将不断基于此优化模型,帮助广告主达成更高 GMV。
记得关注我们
及时接收精彩内容哦~
公众号【腾讯太极机器学习平台】
——文章来源于“腾讯广告算法大赛”
“太极”助力,腾讯如何借大模型降本增效?相关推荐
- “讯飞星火”大模型计划10月底赶超ChatGPT
文章目录 前言 你使用过这种对话式AI吗?有什么看法或感受? "讯飞星火大模型将超越chatgpt?" 这类型的人工智能对现在的社会有什么意义? 这类型的人工智能,未来前景如何? ...
- 时隔一个月,讯飞星火大模型 V1.5 发布:星火 APP 登场,综合能力升级
近日,讯飞再次发布了一项重大的更新,将其星火大模型升级至 V1.5 版本,同时推出了全新的星火 APP,为用户提供更加全面的智能服务. 据了解,讯飞星火大模型 V1.5 版本在综合能力方面进行了三大升 ...
- 讯飞星火大模型体验报告
近日,科大讯飞召开了星火认知大模型成果发布会,会上表示讯飞星火大模型将突破开放式问答,对标ChatGPT,在中文能力上超过ChatGPT,在英文能力上与ChatGPT相当.对此,你怎么看? 笔者准备给 ...
- 云上接单不空跑 京东云助力“佬司机”为货运物流业降本增效
李师傅当了三年多的货车司机,经常穿行在陕蒙川三省(区)之间,跟很多同行一样,货源信息匮乏一直是让他犯愁的事.直到一款手机应用软件的出现,让困扰他的难题得到解决. "这一单刚完下一单订单就已经 ...
- 如何利用工业大数据降本增效
工业大数据是互联网,大数据和工业产业结合的产物,同时又反作用于产业升级发展.对于制造业而言,了解行业大数据产生的背景,归纳行业大数据的分类和特点,从数据流推动本身价值创造的视角看待.重造工业价值流程, ...
- 时隔一个月,讯飞星火大模型 V1.5 发布:星火 APP 登场,综合能力三大升级!
6月9日,在科大讯飞24周年庆上,讯飞星火认知大模型V1.5正式发布.时隔一月,星火大模型不仅各项能力获得持续提升,且在综合能力上实现三大升级:开放式知识问答取得突破,多轮对话.逻辑和数学能力再升级. ...
- 讯飞星火大模型V1.5发布 刘庆峰:我们要追赶OpenAI
雷递网 乐天 6月9日 讯飞星火认知大模型V1.5今日正式发布.讯飞称,时隔一月,星火大模型不仅各项能力获得持续提升,且在综合能力上实现三大升级:开放式知识问答取得突破,多轮对话.逻辑和数学能力再升级 ...
- 大比拼:讯飞星火大模型将超越ChatGPT?
5月6日,讯飞星火认知大模型成果发布会于合肥举办.会上,备受业界期待的"星火"认知大模型正式发布,讯飞AI学习机.讯飞听见.讯飞智能办公本.讯飞智慧驾舱.讯飞数字员工,四大行业中的 ...
- 用讯飞星火大模型1分钟写一个精美的PPT
文章目录 前言 SparkDesk讯飞星火认知大模型简介 利用讯飞星火写一个转正述职ppt 1.告诉讯飞星火我想写一篇转正述职ppt 2.利用MindShow一键生成ppt 申请体验 写在最后 ✍创作 ...
最新文章
- 计算机网络实验ip数据报转发,计算机网络实验报告三网际协议IP.doc
- nlp homework 03
- Servlet中使用RequestDispatcher调派请求--include
- CentOS 6上配置安装MariaDB,二进制文件,非源码
- Dapr + .NET Core实战(三)状态管理
- python的程序格式框架_关于Python程序格式框架的描述,以下选项中错误的是
- 中国网建java发送短信_短信验证登陆-中国网建提供的SMS短信平台
- 统计list里面相同元素个数_LeetCode 第 347 号问题:前 K 个高频元素
- vc安装.zip_空间分析:4-1.分词模型hanLP简介与安装
- java 工具类库 Apache Commons
- 面试官:什么是对象池?有什么用?别说你还不会!
- HeadFirstJava——6_Java API
- 轻量级的java HTTP Server——NanoHttpd
- 批量检测支付宝是否开通
- 百度技术:“App 优化网络,先从 HTTPDNS 开始” | 原理到实战
- 好设计如何诞生:关于好设计的100件事
- dom4j读取http xml文件
- 开源免费Webrtc转发服务器Mediasoup的概念解释与基本介绍(一)
- Java 丢手绢游戏 求和_java入门小程序—17人游戏(丢手绢问题)
- aix 安装oracle smit install_latest,Oracle 9i在AIX5L系统上的详细安装过程
热门文章
- DSPE-PEG-FA Folic acid PEG DSPE 磷脂-聚乙二醇-叶酸溶于有机溶剂
- Middleware中间件
- android真机调试 红米,红米Note3 USB调试在哪里?红米Note3打开usb调试模式方法图解...
- 前端学习笔记 - 1
- react利用useEffect记录用户在当前页面停留时长
- StringUtils工具类
- 01JavaScript基础
- 期货市场技术分析03_主要反转形态
- 加载WSGI Application的核心配置api-paste.ini
- 真无线蓝牙耳机什么品牌比较好?五大高性价比真无线耳机推荐