Mux 流媒体专家Phil Cluff在4月19、20日举办的LiveVideoStackCon 2019上海音视频技术大会中发表了主题演讲,并根据自己在大会中的所见所闻,对其它部分精彩内容进行了详细的分析与总结。

文 / Phil Cluff

译 / John

原文

https://mux.com/blog/highlights-livevideostackcon-shanghai-2019/

上个月,我很荣幸地被邀请参加在上海举办的LiveVideoStackCon 2019 音视频技术大会并就如何设计出色的视频API进行了主题演讲。不得不说,这是一场由LiveVideoStack组织的专注于在线流媒体等音视频技术、服务与解决方案的饕餮盛宴。

LiveVideoStackCon 2019对我们——Mux与Demuxed会议的运营者来说是一个不错的能与音视频行业的优秀同仁沟通交流机会,因此我决定跨越大半个地球来到令人惊叹的上海参加这场技术大会。

为期两天的LiveVideoStackCon 2019 上海吸引了400-500名中国最优秀、最具创新力的音视频工程师。在这场大会中我不仅发表了主题演讲,还参与了多场讲座与圆桌会议,内容包括但不限于AI+多媒体、视频编解码、开源技术栈与多媒体传输网络。虽然我的中文不算出色,但凭借在音视频领域的多年耕耘与谷歌翻译的良好协助,我完全体会到了与会嘉宾和观众的热情以及音视频技术不断发展的澎湃动力。

中国正在成为机器学习的领导者

尽管在Mux,我们认为自己是将机器学习应用在音视频领域的行业领导者——例如我们的基于机器学习的Per-Title编码解决方案与和自适应编码相关的产品等;但让我们感到震惊的是,我们在LiveVideoStackCon上看到的大量基于机器学习的解决方案与商业应用,从TCP的选择到图像识别优化,都是借助神经网络得以实现。我们十分期待能在Demuxed 2019看到这样机器学习的行业应用百花齐放的局面。

来自中兴微电子的人工智能首席科学家徐科借主题演讲,深入浅出地分享了如何将机器学习运用于视频传输与分析当中;除此之外徐科还谈到了机器学习在计算机视觉领域的一些挑战并提供了一系列应用实例,让我倍感惊讶的是在这场演讲上,徐科对去年十月在“自然”杂志上发表的一篇题为《基于伦理学的机器学习实验(“The Moral Machine experiment” )》的论文进行了可视化分析。此实验旨在分析危险发生时人们的主观选择对于机器学习算法的影响,并揭露了不同国家与地区文化和社会的差异——例如当危机发生时,英国人相对于美国人更愿意把更多生存的机会留给年轻人。

我最喜欢的基于机器学习的解决方案之一是用于选择由智能手机拍摄的照片,其最佳曝光后处理设置参数的机器学习训练算法,该算法由同济大学开发并逐渐落地。除了执行所有我们已知的传统方法,此解决方案还执行了Google的“Auto Awesome”特性。

为什么中国会成为机器学习领域的领导者?从一些研究机构给出的结果我们不难找到答案——首先,中国拥有全球规模最大的消费电子市场,这不仅仅是因为中国拥有全世界最多的人口数量,还因为中国拥有一个以技术为导向的社会与市场。与西方相比,中国的移动支付技术正经历着爆炸式增长。据观察,中国政府对人工智能研究的投入大大高于其他任何西方国家,尤其对于图像分析和面部识别的研究更是颇为重视,西方国家需要花费很大资源与时间才能赶上中国现在取得的技术水平。

中国仍在继续推进自己的视频编解码器

在之前的很长一段时间内,我并没有在维基百科等渠道听说过AVS(Audio Video Standard)——一个几乎只在中国开发与使用的音视频多媒体编解码器。AVS的第一个版本实现了足以比肩MPEG 2与H.264的压缩比,其中编解码器的更新版本AVS +压缩效果大致与H.264相当。AVS解码器通常位于机顶盒中以接收有线和卫星广播,在一些Android电视或机顶盒中我们可以发现AVS系编解码器的存在。而自亚马逊宣布推出Alexa语音服务以来,依赖Google Android的AVS发展面临重重阻力,特别是因为Alexa现在开始越来越多地出现在家庭智能影音设备之中。

但出乎我意料的是AVS协议仍处于积极的开发状态中且最新的标准版本AVS2声称其压缩性能已优于HEVC。令人遗憾的是,由于未能实现桌面浏览器或iOS设备的支持,AVS2似乎不太可能在中国以外的其他地区取得商业成功,尽管与HEVC相比,AVS2具有更明智的专利池结构。

基于AV1的商用编码器不断涌现

虽然诸多中国公司继续对AVS2等本土编解码器追加投资,但开源编解码器特别是AV1仍为大家关注的重点。来自腾讯的刘杉借主题演讲对当前编解码器的总体发展进行了精彩的阐述,而Zoe Liu则以AV1的更新为主题,详细介绍了rav1e与dav1d的最新改进;除此之外,Zoe Liu的公司Visionular构建了一套基于机器学习的增强型视频编码器,她展示了这套全新开发的AV1编码器Aurora的一些参数与数据。从质量和性能的角度来看,目前Aurora的综合性能优于libaom;而某些测试序列的VMAF得分则提高了30%以上,在质量和编码性能方面Aurora也优于lib-x265。值得注意的是,libaom并未针对性能进行特别优化,而是被设计成参考级编码器。

尽管Zoe并没有比较Aurora与rav1e或SVT-AV1,尽管两者都可在许可证下免费获得,但我们相信,为了与免费产品竞争,Aurora必须表现出足够的速度或质量改进。然而Visionular宣称即将推出一款软件实时编码器,这在商业市场上还属首例。

在Mux,我们将继续研究、开发和测试AV1生态系统中的商业与免费软件。我们坚信开放的编解码器生态系统适合每一个参与音视频行业建设的开发者,我们希望为此生态系统的良性发展作出贡献。

备用TCP堆栈逐渐普及

TCP的举足轻重有目共睹。尽管在大多数互联网设备与服务中被使用,但TCP并非为互联网而生。现代网络架构与CDN并不一定需要TCP中存在的积极拥塞与流量控制机制。

很长一段时间以来,企业为了提高数据吞吐量,减少延迟并增强数据链路的可靠性,一直在尝试实现兼容TCP的网络堆栈。其中尝试的一些方法依赖于在已经接收到先前有效载荷的TCP ACK之前抢先发送的后续数据序列,其目的是有效调整拥塞控制算法。但此类型技术需要被微调以减少阻碍正常带宽的风险, TCP应当与同一网络上更传统的TCP实现共存。

来自Akamai的Will Law在LiveVideoStackCon上借主题演讲详细阐述了Akamai如何通过兼容各种不同的TCP以提供最佳性能的TCP协议加速技术,包括FastTCP(2012年被Akamai收购)、BBR(Google的TCP替代方案,被Fastly与Spotify使用)、RENO与CUBIC等。与此同时,Akamai正致力于训练神经网络,该网络可以识别出在每个HTTP请求中使用何种拥塞控制算法以达到最佳效果。不得不说这真的很新颖!

在中国的这段时间我也有幸与Cascade Range Networks的Sean进行了交谈,并了解一些他们正尝试使用兼容性TCP替代Linux网络堆栈的探索。让我印象深刻的是,他们借软件部署设备之间的差异,实现从10美元的闭路电视摄像机到10,000美元的核心网络服务器都显示出性能的显着提升。

我们将密切关注这一领域的发展。我们对Cascade Range Network的产品以及即将推出的谷歌BBR V2感到非常期待。

摘要

如果你有机会来到中国,那么LiveVideoStackCon将是一场不容错过的绝佳技术盛宴。我非常享受在上海的时光,更多是因为这里有着与欧美等国家截然不同的技术发展理念,让我们学会了掌握核心技术的特别奥义。

LiveVideoStack  招募

LiveVideoStack正在招募编辑/记者/运营,与全球顶尖多媒及技术专家和LiveVideoStack年轻的伙伴一起,推动多媒体技术生态发展。了解岗位信息请在BOSS直聘上搜索“LiveVideoStack”,或通过微信“Tony_Bao_”与主编包研交流。

LiveVideoStackCon 2019北京正在招募讲师,无论你是技术派还是学术派,亦或是行业专家,无论你的团队有多小、有多新,都可以来申请成为LiveVideoStackCon的讲师。点击【阅读原文】了解更多大会相关信息。

音视频技术的高光时刻: LiveVideoStackCon 2019上海 音视频技术大会相关推荐

  1. 参会者说丨LiveVideoStackCon 2019上海 音视频技术大会

    技术盛会?行业前沿?思想碰撞?看看参会者怎么说! 4月19日到20日的LiveVideoStackCon 2019上海音视频技术大会在上海圆满落下帷幕.作为深耕音视频技术的社区媒体,LiveVideo ...

  2. LiveVideoStackCon 2019上海 优秀出品人与讲师

    感谢LiveVideoStackCon 2019 上海所有出品人与讲师不遗余力的支持与贡献. 经过将近6个月的不断努力,为期两天的 LiveVideoStackCon 2019上海 音视频技术大会终于 ...

  3. 天津轻工职业技术学院计算机专业怎么样,2019年天津轻工职业技术学院有哪些专业?...

    2019年天津轻工职业技术学院有哪些专业? 建校日期:2001 院校类型:大专学校 学校属性:自主招生 学校官网:www.tjlivtc.edu.cn 所在地域:天津 学校地址:天津海河教育园区雅观路 ...

  4. Vue.js 作者在 VueConf 2019 上海演讲视频

    2019年6月8日来自全球各地的开发者齐聚上海交通大学文治堂,一起见证了VueConf 2019 上海的成功举办. 在大会上,Vue.js作者尤雨溪给大家带来了主题为"State of Vu ...

  5. 全国专业技术人员计算机D级,2019年全国专业技术人员计算机应用能力考试最新题库.doc...

    PAGE PAGE 1 2019年全国专业技术人员计算机应用能力考试最新题库 一.计算机基本知识 单选: 1.第一代计算机以电子管为主要部件,主要应用于( C ) A.数据处理 B.实时控制 C.科学 ...

  6. 电子信息科学与技术学c语言吗,2019电子信息科学与技术专业怎么样、学什么、前景好吗...

    电子信息科学与技术专业是一个宽口径的专业,包括电子科学技术和信息科学技术与技术两项内容,学习内容涉及电子学.信息技术.计算机三大知识板块,其培养方向有些院校涉及三个方向,如无线通讯.图像传输与处理.信 ...

  7. LiveVideoStackCon 2019北京 优秀出品人与讲师

    感谢LiveVideoStackCon 2019 北京所有出品人与讲师不遗余力的支持与贡献. 在10余位出品人以及80余位讲师的共同支持与努力下,为期两天的 LiveVideoStackCon 201 ...

  8. LiveVideoStackCon 2019北京 Day One精彩瞬间

    意犹未尽,精彩继续,开放交流,生态共赢. 8月23日是LiveVideoStackCon 2019北京音视频技术大会第一天,这是这一全球顶级的音视频技术大会连续第三次在北京举行.大约有550名多媒体技 ...

  9. LiveVideoStackCon 2019北京日程发布

    LiveVideoStackCon 2019北京音视频技术大会即将于8月23-24日召开,经过团队与各专题出品人.大会联席主席的努力,今天,我们公布了LiveVideoStackCon 2019 北京 ...

最新文章

  1. 关于endian的故事,big-endian和little-endian
  2. 清华唐杰团队:一文看懂NLP预训练模型前世今生
  3. 2225!全国电厂名单大全
  4. linux操作系统之exec函数族
  5. 闲话WPF之十八(WPF中的资源 [4] )
  6. java机器PDF_机器人制作入门(第3版)PDF 下载
  7. android studio 布局设计,Andriod界面设计适配和Android Studio中的资源
  8. 微信小程序图片四个API用法
  9. 安装winrunner和HP QTP
  10. 网络共享中心的计算机名,电脑提示“请启用网络和共享中心中的网络发现”解决方法...
  11. vue2.0和3.0引入阿里字体图标库的步骤
  12. 2022年Google I/O 大会即将举行,可领取 2022 年 I/O 大会参会开发者资料徽章。
  13. 程序员裸辞,利用1个月时间全力找工作,怎么样?
  14. mysql 数据库清理缓存
  15. 根据出生日期获取农历信息
  16. 宝塔Linux面板:SSH终端登入总是提示请输入password
  17. 【摄影】如何利用手机拍摄好的摄影作品
  18. python设置word背景色_Java 给Word不同页面设置不同背景
  19. CentOS下mysql 8.0.16 安装完整版教程
  20. 1万人游戏服务器多少钱?

热门文章

  1. php编译安装与配置
  2. PowerShell【变量篇】
  3. [转]SSH反向连接及Autossh
  4. 设计模式系列·王小二需求历险记(一)
  5. python2.6 2.7 升级成3.6之后yum
  6. HDU - 6156 Palindrome Function(数位dp)
  7. CodeForces - 1300E Water Balance(贪心)
  8. 中石油训练赛 - DNA(字符串哈希)
  9. PAT (Basic Level) 1073 多选题常见计分法(恶心模拟)
  10. UVA11212Editing aBook 编辑书稿