10月30日,一年一度的MSU世界编码器大赛全高清(FullHD)客观性能赛道成绩公布,官方正式报告显示,继去年阿里自研S265取得两项PSNR指标第一名,阿里自研的VVC编码器S266首次亮相,就一举获得离线(1fps)档9项评测指标中的6项第一,2项第二,1项第三。另外,在包含56项评测指标的企业版完整测试报告中,S266更是获得其中的40项第一,10项第二,6项第三,成为唯一一个离线(1fps)档所有指标都进入前三的编码器。

阿里巴巴音视频实验室负责人、淘系产品技术&平台生态业务负责人汤兴(平畴)表示,内容化正在驱动互联网进入新周期,音视频技术的重要性越来越高。此次阿里S266在MSU取得出色成绩,是淘系技术长期以来对音视频领域的持续投入和不断创新的阶段性成果。随着以淘宝直播、逛逛为代表的内容化业务的发展,内容场和电商场的双重复杂度不断叠加,未来不仅是音视频技术,淘系技术在多模态、3D XR、认知计算与知识图谱等技术领域的迭代长期都会处在加速状态。

6项指标第一

今年MSU世界编码器大赛云集了国内外14家参赛单位的22款编码器,包括华为、腾讯、爱奇艺、Google、Intel、MulticoreWare、HHI等知名科技企业或研究机构,可谓高手云集,竞争十分激烈。

MSU本次发布了全高清客观性能赛道的测试报告:

https://www.compression.ru/video/codec_comparison/2021/main_report.html

该报告给出了各个参赛编码器在多项质量评价指标下的压缩性能,这些指标包括实际业务场景中广泛采用的SSIM、PSNR、MS-SSIM、VMAF等客观质量评价指标。

最终,经过激烈地角逐,阿里巴巴继去年S265取得两个档次PSNR指标第一名成绩之后,今年自主研发的VVC编码器S266一共获得了离线(1fps)档9项评测指标中的6项第一、2项第二和1项第三,即:

6项指标第一

YUV (4:1:1)-VMAF NEG、YUV (6:1:1)-VMAF NEG、YUV (4:1:1)-PSNR (avg. log)、YUV (6:1:1)-PSNR (avg. log)、YUV (4:1:1)-PSNR (avg. MSE)、YUV (6:1:1)-PSNR (avg. MSE)

2项指标第二

YUV (4:1:1)-SSIM、YUV (6:1:1)-SSIM

1项指标第三

Y-VMAF

S266也因此成为唯一一个离线(1fps)档所有指标都进入前三的编码器。

先来看全高清客观性能离线(1fps)档赛道MSU官方成绩:

  按YUV (4:1:1)-VMAF NEG和YUV (6:1:1)-VMAF NEG这两个指标排名:

第一名:阿里巴巴S266_v2
第二名:阿里巴巴S266_v1
第三名:华为HW266、腾讯Tencent266

测试数据越小表示压缩率越高,成绩越好。

图中显示,在同等YUV (4:1:1)-PSNR (avg. log)画质下,S266比基准编码器x265节省了50.9%的文件大小;在同等YUV (6:1:1)-PSNR (avg. log)画质下,S266比基准编码器x265节省了45.9%的文件大小。

  按YUV (4:1:1)-PSNR (avg. MSE)指标排名:

第一名:阿里巴巴S266_v1

第二名:阿里巴巴S266_v2

第三名:华为HW266

图中测试数据越小表示压缩率越高,成绩越好。

图中显示,在同等YUV (4:1:1)-PSNR (avg. MSE)画质下,S266比基准编码器x265节省了44.4%的文件大小。

▐  按YUV (6:1:1)-PSNR (avg. MSE)指标排名:

第一名:阿里巴巴S266_v1

第二名:腾讯Tencent VAV1

第三名:腾讯Tencent266

测试数据越小表示压缩率越高,成绩越好。

图中显示,在同等YUV (6:1:1)-PSNR (avg. MSE)画质下,S266比基准编码器x265节省了41.3%的文件大小。

MSU世界编码器大赛

MSU世界编码器大赛是指由莫斯科国立大学(Moscow State University)主办的面向全球各大公司、学术机构、开源社区和个人的编码器比赛,从2005年起每年举办一次,现已成为视频编解码领域影响力最大的顶级权威赛事,谷歌、Intel、Netflix等在视频编解码领域颇有技术积累的科技巨头都曾多次参加该项赛事,参赛编码器代表了行业发展的风向标。

MSU的图形与媒体实验室(Graphics & Media Lab)作为权威的第三方视频编码器评测机构,在编码器评测方面颇有年头,从H.264、H.265、VP9、AV1到最新的VVC,其评测报告已被全球广泛认可,有较高公信力,对推动全球编解码技术发展、促进编码器性能提升方面有标杆示范作用。

本届大赛共有22款编码器参赛(包括参照编码器在内),分别来自于14家单位或个人,涵盖了H.264、VP9、H.265、AV1、AVS3、H.266等多种视频编解码标准,这些标准在业界具有广泛的代表性。

为什么需要多种维度的评价指标?

和商用编码器在实际业务中进行质量评估时并不能只依赖一种质量指标一样,MSU世界编码器大赛也采用多种客观质量评价指标,其中,SSIM(含MS-SSIM)、PSNR、VMAF是在实际业务场景中被广泛采用的全参考客观质量评价指标,分别从结构相似性、均方误差、多个时空度量组合模拟主观质量这三个维度评价编码器输出的失真视频相对于原始视频的相似程度或保真程度。

PSNR指标使用最为普遍,历史也更为悠久,是基于对应像素点间的误差,即基于误差敏感的图像质量评价方法。PSNR在促进编解码标准发展进程中起到了至关重要的作用,目前仍是视频编解码器标准化事实上的行业标准。但是由于PSNR并未直接考虑到人眼视觉特性,因而在有些情况上会出现评价结果与人的主观感受不完全一致的情况。

SSIM指标从亮度、对比度和结构三个方面来估计失真图像的视觉质量,旨在比较原始视频和失真视频的结构信息,研究感知结构的损伤,而不是感知误差。但SSIM指标在评价噪声图像、模糊图像时也有一定局限性。MS-SSIM是在SSIM基础上的改进,衡量了多尺度的结构相似性。

VMAF作为近些年出现的评价指标,利用大量的主观数据作为训练集,通过机器学习的手段将不同评估维度的算法进行“融合”,旨在得到一个能准确反映主观意志的画质评价标准。VMAF经过了若干年的迭代和优化之后,最新的版本可以更好的克服一些之前发现的问题,在更大的程度上能够反映人眼主观感受,因此近几年在商用系统中逐渐开始得到更加广泛的应用。但人眼视觉系统是一个复杂系统,VMAF指标依赖于符合主观特性的融合算法,还要有大量有效的、符合实际评测环境的数据集,是一个需要长期投入,不断迭代的优化过程。

在实际操作中,客观评价的内容是物理参量,评价的手段是物理量测量度,所以客观评价能够做到严格准确,具有较高的科学性和客观性。此外,编码器的不同模块和算法优化对各项质量评价指标的敏感程度和表现差异也不尽相同。因此,根据实际业务场景,在编码器开发的不同阶段,采用多种客观评价方法相结合的形式,可以全面评估编码器优化效果,充分兼顾压缩视频的综合质量。

阿里自研VVC编码器,能在本届MSU大赛中获得包括PSNR、SSIM、MS-SSIM、VMAF等9项评测指标中的6项第一、2项第二、1项第三,成为唯一一个所有指标都进入前三的编码器,充分体现了S266编码器在各项指标下的均衡表现和综合实力。

展望及未来商用之路

通过MSU的权威认证,展现了S266强大的压缩效率,但要推动VVC标准的商用,路还很长。这是因为VVC作为HEVC的下一代编码标准,引入了诸多新的编码工具,这些工具一方面带来了压缩效率的提升,同时也对算力提出了更高要求。经测试,在一台内置Intel i7-8700k芯片的个人电脑上,用VVC参考模型VTM11.0压缩一段1080p视频,只能达到0.005帧每秒,而常见视频一般为30帧每秒,需要提速6000倍。

与此同时,压缩的视频要让消费者能看到,还需要一个解压的过程。经过近十年的普及,常见手机芯片已经能解码HEVC标准的视频,但VVC标准压缩的视频还不能支持。通过手机的CPU做软解压是一个方案,但解码速度同样缓慢。在一台华为P40手机上,用VVC参考模型VTM11.0解压一段1080p视频,只能达到 9 fps。

为了攻克这些技术难题,阿里巴巴淘系技术沿用在S265上的大量专利技术,对VVC标准工具集进行大量研究,合理选择编码工具的组合来拿到VVC高压缩效率的红利,并使用机器学习方法,快速进行块划分和编码模式决策,对RDO过程精简并引入跨帧并行和CTU并行,大幅提高多核CPU的执行速度,还使用汇编指令集加速向量计算、优化内存访问效率。经过大量优化,S266的编码器慢速档比VTM11.0提速大于200倍,在快速档上能达到实时编码。另一方面,为了尽可能提升编码器的压缩效率,S266引入了基于CU-tree的预分析流程,并将预分析与编码过程紧密结合,使用基于块的运动补偿时域滤波技术减少预测误差,并采用自适应GOP决策,场景切换检测,屏幕内容检测技术来提高场景适应性;在码率控制上,S266使用帧,行,块三级码控,结合场景检测和噪声检测,精准有效的分配每个bit到最恰当的地方。在解码速度上,淘系技术经过大量优化,于2021年4月向业界公布了手机端的VVC实时解码器,普通手机仅使用2核就可以解码720p视频,最新发布的手机甚至可支持4k 30fps实时解码。

阿里巴巴音视频实验室负责人、淘系产品技术&平台生态业务负责人汤兴(平畴)表示:“淘系技术长期以来对音视频领域的持续投入和不断创新,造就了今天S265、S266在MSU世界视频编码器大赛的好成绩,以及在淘宝直播、逛逛、点淘中超高清视频的表现。未来的8K、VR/MR、元宇宙等,也将随着视频编解码技术的创新而蓬勃发展。期望淘系编解码团队,从业务场景出发,以进益求精的态度,进一步追求效率高,速度快,延时低的编码技术,加速S266编码器的技术创新,加快VVC标准在内容化社区的商业落地。”

✿  拓展阅读

作者|淘系技术

编辑|橙子君

出品|阿里巴巴新零售淘系技术

MSU2021世界编码器大赛成绩公布,阿里自研编码器获六项第一相关推荐

  1. MLPerf发布首个AI芯片推理测试排行榜:阿里平头哥含光800获得多项第一

    晓查 发自 凹非寺  量子位 编译 | 公众号 QbitAI 今天MLPerf基准联盟公布了第一批AI芯片的推理测试结果,对来自19个公司机构的594种芯片在各种自然语言和计算机视觉任务中的表现进行了 ...

  2. 世界视频编码器大赛结果出炉,腾讯香农编码器跻身世界一流

    2018年9月5日,世界视频编码器大赛成绩揭晓,腾讯自主研发的编码软件"香农编码器"(Tencent Shannon Encoder,简称T265)首次参赛即获得优异成绩,跻身世界 ...

  3. 世界视频编码器大赛结果揭晓,腾讯V265编码器勇夺两项第一

    2019年10月22日,由莫斯科国立大学(Moscow State University)举办的MSU世界视频编码器大赛成绩揭晓, 腾讯内部开源协同的V265编码器再创佳绩,一举拿下PSNR(峰值信噪 ...

  4. MSU 2019世界编码器大赛

    MSU 2019世界编码器大赛的全高清客观质量测试报告于10月21出来了,报告分为免费版本和收费版本($950).收费版本包含了所有测试结果,免费版本只包含了部分结果.两者区别如下: 此次参与测试的1 ...

  5. 2020世界机器人大赛:BCI脑控机器人大赛技术赛B榜成绩最终公布

    中国电子学会将联合相关单位举办的2020世界机器人大赛-BCI脑控机器人大赛,旨在打造集科技性.创新性.实用性于一体的世界级脑-机接口赛事,使之惠及人类社会生活发挥积极作用. 本次大赛技术赛重点考察各 ...

  6. 第44届世界技能大赛中国参赛项目集训选手名单公布,388人入选!(人社部今日发文)

    一.飞机维修项目(5人) 叶钟盛 江西航空技师学院 刘  运 中航工业江西洪都航空工业集团有限责任公司 彭  胜 中航工业江西洪都航空工业集团有限责任公司 薛惠荣 中航工业江西洪都航空工业集团有限责任 ...

  7. 第二届全国职业技能大赛和世界技能大赛云计算赛项该如何备战?

    世界技能大赛是世界性职业技能赛事,被誉为"世界技能奥林匹克".中华人民共和国职业技能大赛对接世界技能大赛,由人力资源社会保障部主办.云计算赛项为两项赛事的重要赛项,获奖团队(选手) ...

  8. 腾讯天衍实验室夺世界机器人大赛双冠军,新算法突破脑机接口瓶颈

    日前,"2020世界机器人大赛-BCI脑控机器人大赛"公布成绩,腾讯天衍实验室和天津大学高忠科教授团队组成的C2Mind战队,经过多轮赛程的激烈比拼,实力入围BCI脑控机器人大赛& ...

  9. 比世界纪录快3倍 阿里云377秒完成100TB数据排序

    本文讲的是 比世界纪录快3倍 阿里云377秒完成100TB数据排序,10月28日,Sort Benchmark在官方网站公布了2015年排序竞赛的最终成绩.阿里云用不到7分钟(377秒)就完成了100 ...

最新文章

  1. 【转】判断UIViewController是否正在显示
  2. ubuntu使用fail2ban_如何在Ubuntu 20.04上安装和配置Fail2ban
  3. bga焊盘怎么做_BGA封装的类型及焊盘设计的基本要求有哪些
  4. 2017.12.1T19_B2_2zuoye
  5. 核心动画与UIView的区别
  6. Linux shell重复执行某命令n次
  7. python中初始化方法_Python中类的初始化特殊方法
  8. 鸿蒙技术论坛,鸿蒙应用开发入门(六):页面间跳转
  9. 泛微OA的http接口创建
  10. 友达37寸长条液晶屏P370IVN04.1-原厂长条屏
  11. SWOT分析思维的一些基本思考与见解
  12. 搭建web项目常见错误
  13. 惠普电脑u盘重装系统步骤_惠普电脑如何重装系统?惠普电脑用U盘重装win10系统教程...
  14. 人工智能辅助服装设计 | Mixlab论文带读
  15. ipad、iphone 怎么真机调试
  16. TI/德州仪器 SN74AHC1G04DBVR 单路反向器闸
  17. 安全的可靠的数据防泄密系统
  18. 安装office提示Office 16 Click-to-Run Extensibility Component
  19. python中class什么意思_python – 这个代码中classmethod做了什么?
  20. 青少年护眼灯哪个牌子好?青少年护眼灯品牌排行榜

热门文章

  1. 开源微信商城小程序源码和商城小程序开发
  2. 干式电抗器设备GIM模型要求
  3. 希赛教育计算机网络基础,2020年9月网络教育统考《计算机应用基础》计算机网络模拟题试卷1...
  4. 【开源】PaddleOCR一键识别万物
  5. 数据结构-折半查找法的ASL计算
  6. win10安装过程修改esp分区吗_ghost版Win10系统的安装教程
  7. windows7 企业版的应用
  8. Android 可滑动的悬浮View
  9. 需求管理之需求优先级的排序-需求优先级分析方法论-波士顿矩阵和KANO模型
  10. aardio 谷歌浏览器自动化 (四) 浏览器动作和信息获取