“太极”助力，腾讯如何借大模型降本增效？

更低成本、更优效果，也就是“降本增效”，是所有广告投放追求的目标。广告技术的发展正让“降本增效”越来越具体、越来越可以量化和感知，比如目前互联网广告平台开始以 GMV （成交金额）或 ROI（投入产出比）为营销效果的评估标准。

一次更高效的广告投放，本质上是在合适的场景，让对的广告出现在对的人面前。这离不开广告平台对广告内容和用户群体的深刻理解，并在他们之间达成更准确的匹配。

腾讯广告已经为为此交出了一份答卷：首先，以国际领先的混元AI大模型助力系统深刻理解广告内容，其次以精排大模型提升广告和用户的匹配准确率。此外，这两者的底层都离不开一个业内领先的机器学习平台——太极。

混元 AI 大模型——让系统深度理解广告内容

在近10年的 AI 研究中，工程师和科学家们越来越达成一个共识：越大的模型才能有越高的理解能力。

早期的深度学习模型大约有六千万参数，大约230MB大小，能够把日常物体分成一千个类别；今年火热的绘画 AI “DALL-E2” 则已经有大约 70 亿参数，大约 26GB 大小，输入一句描述句子就能画出一张对应的画，内容准确、视觉效果优美，体现出顶级的文本和图像理解水平。

大模型成为了一个重要的技术演进方向，而这正是广告推荐所需要的核心能力。

广告中既有艺术和创意，也有感情和期待，推荐系统要首先能够理解广告中蕴含的丰富信息，才能做出恰当的推荐。腾讯自研的深度学习大模型——腾讯广告混元 AI 大模型就是广告系统理解内容的核心引擎。

腾讯广告混元 AI 大模型，是一个具有千亿参数的大模型，能够准确理解文字和图像中蕴含的各个层面的信息；它甚至可以把文字、图像、视频作为一个整体来理解，这样不仅对广告的理解更准确，也更符合平台用户对广告的整体感受。

腾讯广告混元 AI 大模型和类似的图文理解模型做过全面的正面对比，目前横扫跨模态检索领域5大权威测评集大满贯、多模态理解领域国际权威榜单VCR上排名第一、CLUE自然语言理解分类榜及CLUE总榜登顶，比大部分模型的图文综合理解能力还要强，是国内当之无愧的多模态、跨模态AI大模型。

混元AI大模型的多模态理解能力，可以有效的加深推荐系统对于广告的理解，从而更精准的将广告推荐给合适的人群，提高用户体验以及广告转化效果。

除了理解已有的广告内容，混元AI大模型还有文字&图像&视频综合生成能力，已经以产品的形式在腾讯广告投放平台提供给每一位广告主，可以极大的提升广告制作的效率。

“图生视频”功能，可以将静态的图片自动生成不同样式的视频广告；
“文案助手”功能，可以为广告自动生成更恰当的标题，提升广告的效果；
“文生视频”功能，未来只需要提供一句广告文案，就可以自动生成与之匹配的视频广告。

精排大模型——让系统更准确匹配广告和人群

在理解广告之后，广告平台还面临一个挑战：把广告展示给合适的人群。模型在解决这一挑战中发挥了核心作用，特别是精排模型。

广告平台上有数以万计的广告主和数以亿计的用户，即便经过广告定向的筛选，匹配一次用户请求的广告仍然可能有成千上万，具体向用户展示哪一个或者哪几个广告才能在尽量符合用户偏好的同时为广告主带来最大的收入，这就是一个极为复杂的多对多匹配问题，需要精细的预估和排序。

腾讯广告精排大模型就是为了解决这个难题而设计的。单模型推理参数达千亿级别，序列化后大小可达数百GB，浮点数计算量最高每秒超过10亿次，在行业位于先进水平。

如此大的模型，最明显的收益是可以利用更多的特征和样本数据，学习得到更强大更精确的模型，进而实现更准确的匹配效果和更高的广告主回报，比如：

可以利用更长期、更细致的用户原始行为数据，在合规前提下强化用户洞察，对人群的理解更清晰准确；
可以利用更多场景、页面、上下文信息，在跨场景联合建模的同时强化场景差异性表达，降低维护成本，提升用户广告体验；
可以利用更长期的样本数据，配合恰当的模型结构和学习算法，平衡不同行业不同稀疏程度广告主投放目标的学习，提升投放效果；
可以更好地利用混元AI大模型在广告理解层面得到的丰富信息，实现更好的泛化和广告冷启动。

腾讯广告精排大模型各项算法指标相对于百亿规模小模型有显著提升，全流量上线后，用户可以看到更符合自己兴趣的广告，广告主也可以期待有更高的投放回报。相比以前的小模型算法，腾讯广告精排大模型已累计给广告主带来15%的GMV提升。

精排大模型迄今为止的效果提升还只是一个开始，大模型平台系统和模型算法会持续升级，与此同时，大模型能力也会逐步向召回、粗排等其他环节辐射，不断抬高效果的天花板，为用户和广告主提供更佳的广告体验。

太极机器学习平台——支持TB级大模型顺利运转

腾讯广告平台需要为亿级的用户、海量并不停增加的广告内容提供服务。大模型+高访问压力，对广告平台的承载能力和计算能力都提出了很高的要求。实际上腾讯广告精排大模型的要求尤其苛刻，不仅模型大小是业界顶级，还需要在用户等待页面加载的极短时间内就完成广告匹配。

为了满足这些规模和性能要求，腾讯专门自研搭建了业界一流的太极机器学习平台，可支持10TB级模型训练、TB级模型推理和分钟级模型发布上线，扩展集群规模则可支持更大的模型训练和推理，为实际业务提供大模型的情况下，同时具有很高的性能，达到行业领先水平。

太极机器学习平台采用了分布式参数服务器架构，这是业界第一梯队企业们公认的最佳选择。这种架构的特点是，存储模型参数和执行模型计算，这两种任务在分别的服务器上运行，增加更多服务器就可以支持更大、计算需求更高的模型。太极机器学习平台中的参数服务器系统AngelPS也是腾讯自研的成果，现在不仅可以承载10TB级模型的训练，对多维特征融合、复杂模型结构等更高级、更前瞻性的功能也有优秀支持。

同时太极机器学习平台还具备超大模型在线推理服务的能力。推理计算方面，不仅支持常规的CPU计算，还支持复杂模型的GPU计算加速；存储上，根据在线推理模型大小，自适应选择小模型本地内存加载和大模型AngelPS远程查询的部署策略；在线服务运营上，平台具备多级容灾能力，脏模型秒级回滚能力，以及完备的系统和业务运行实时指标监控和报警系统。

目前，千亿参数、TB规模训练，百 GB 规模预测的腾讯广告精排大模型能短时间内在太极上完成计算、提供可靠的广告匹配结果。不仅如此，为了提供周全的可靠性、紧跟潮流的匹配能力，上百GB规模的腾讯广告精排大模型需要有多个副本同时运行，每天还需要根据当天的真实用户行为持续学习，这些都依赖太极机器平台强大的承载能力和周全的功能。

太极机器学习平台有突出的模型训练硬件加速能力。以混元AI大模型的训练为例，太极的加速方案高于业界其他方案 3.7倍，有效提升了模型的训练效率。

为了让开发者易学、易用，太极机器学习平台也提供了对常见的 TensorFlow 模型和 API 的支持，同时还提供了多种改进，降低 TF 中复杂的性能优化、内存管理带来的困扰。

可以把太极机器学习平台比作一条多车道的高速公路，大模型就像许许多多的重型卡车，可以在高速公路上高速行驶；相比之下，较落后的技术平台就像是乡间的泥泞小道，只通行一辆小车也颠簸、缓慢。两者能提供的服务以及最终带来的用户体验显然也不能同日而语，而当前具备领先地位的太极机器学习平台，毫无疑问能够帮助提供更好的基建体系，助力大模型们高速运行。

打赢大模型关键第一仗，腾讯广告持续深化技术升级

在腾讯太极机器学习平台之上，混元 AI 大模型和腾讯广告精排大模型共同完善优化了广告理解、用户理解、广告和用户匹配的整个流程，提升对广告的理解，提升广告和人群的匹配效率，提升广告主的推荐精准度和转化效率。在“降本增效”的目标指引下，关注并提升 GMV 的腾讯广告平台技术已经打赢了大模型关键战役的第一仗。未来腾讯广告也将不断基于此优化模型，帮助广告主达成更高 GMV。

记得关注我们

及时接收精彩内容哦~

公众号【腾讯太极机器学习平台】

——文章来源于“腾讯广告算法大赛”