美摄科技成立于2014年,是一家专注智能视音频整体解决方案的国家高新技术企业,致力于视音频与AI技术的融合与创新,目前已服务海内外数千家企业客户。在视音频领域深耕多年,美摄科技凭借雄厚的技术实力,在当今视频化浪潮下不断拓展应用场景,将服务扩展到了智能手机、智能硬件、智能汽车、智慧广电等众多领域,助力平台为用户带来更丰富、更便捷的视频创作体验。本次,LiveVideoStack有幸采访了来自美摄科技的算法工程师侯康,他向我们介绍了过去的一年美摄科技在音视频领域关注的重点、在美摄汽车智能剪辑方案开发过程中所做的工作、研发过程中遇到的“坑”以及最近推出的桌面端深度视频编辑解决方案“美映PC版”等。

侯康:北京美摄网络科技有限公司 , 算法工程师

LiveVideoStack: 侯老师,您好。请您介绍一下您在美摄科技所负责的工作和您近期所关注的技术方向。

侯康: 我目前负责美摄AI算法团队的管理,技术方面主要是针对智能剪辑和图像处理算法的开发。当前我主要关注一些新的AI研究方向,例如transformer在智能剪辑系统方面可能会涉及到的应用点,同时继续拓展和优化美摄的智能剪辑能力。

LiveVideoStack:在过去的一年,美摄科技在音视频领域中关注的重点是什么?取得了哪些成绩?

侯康: 美摄在音视频领域主要关注智能剪辑在各个领域的拓展和应用。美摄在2019年开发出了面向生活类和旅行类视频的智能剪辑系统,并获得了市场的热烈反响,因此后续我们针对各种不同场景进行了大量优化工作。例如在智能汽车领域,我们针对汽车视频拍摄场景的特点和汽车的硬件系统做了大量适配和优化工作,并且加入了面向汽车的特色算法,收到了客户的一致好评。

去年,美摄除了在智能手机、智能硬件、社交平台、政务媒体以及出海等领域持续发力以外,还将服务领域扩展至了智能穿戴、智能汽车等新行业。技术方面我们也取得了新的突破,在国家广播电视总局举办的首届“广播电视和网络视听人工智能应用创新大赛”中,美摄基于深度学习框架的智能视频内容生产平台经过层层评选,最终斩获一等奖。

LiveVideoStack:在这里道一声恭喜!我们也很欣喜地发现美摄开始在智能汽车领域发力,是怎样的契机想到去开发这个场景?

侯康: 随着车辆的普及、硬件升级和用户的认知提升,汽车用户对车辆的诉求也从基础的驾驶代步向全面的驾乘体验转变,简单的车内娱乐已经无法满足用户需求,围绕汽车的生活内容分享变得越来越重要。当前的拍摄硬件大都还是使用手机、相机等外部设备,驾驶过程中用户使用的便利性不佳,拍摄视角也极为受限。此外,目前很少有适合车辆场景的制作工具,用户在利用手机、PC软件进行后期处理时,需要导入长段视频,后期制作难度大,也无法进行实时分享。在此背景下,美摄汽车智能视频处理方案应运而生。

LiveVideoStack:作为全新视频生产平台,汽车进行视频处理与互联网场景下通过移动端、PC端等进行视频创作有什么区别?

侯康: 汽车本身没有像手机和PC那样方便的用户操作界面,因此对于自动化的剪辑方案需求更加迫切。汽车的处理平台和系统目前还是百花齐放的状态,因此需要做大量的适配工作,来满足不同厂家的需求,美摄目前拥有全平台适配的能力。此外,汽车无法像手机和PC那样随时更新软件,并且对安全性和稳定性的要求更高。美摄做了大量工作来满足汽车厂商对于稳定性和安全性的要求,目前我们的SDK和整套智能剪辑系统已经能够稳定地运行在主流厂商的车载操作系统上。

LiveVideoStack:在智能汽车场景下智能视频生产平台研发的过程中遇到的“坑”是什么?如何解决?

侯康: 在智能剪辑系统的开发过程中,主要的难点在于如何针对不同场景进行调优。目前AI技术还无法像真正的导演那样面对不同场景、不同类型的片子都能完成剪辑,因此针对不同场景需要设计不同的框架和算法来达到最优的效果。此外在进行汽车智能剪辑系统开发时,最大的问题还是不同系统和硬件架构的适配过程。由于汽车硬件、处理平台、系统还没有像手机和PC那样较为统一,因此需要做大量工作来进行适配和调优,才能达到流畅稳定的运行状态。

LiveVideoStack:有看到美摄近期推出了桌面端深度视频编辑解决方案“美映PC版”。其实无论是PC端还是移动端,面向内容创作的视频编辑工具也涌现很多,那么美摄是处于怎样的考量去推出这样一款产品呢?

侯康: 美映PC版是一款面向企业用户的深度视频编辑工具,具备全面且高效的专业编辑功能,接入方式简单,支持企业添加自研或其他第三方技术。基于跨平台的美摄SDK,企业可以搭建互通协作的平台及方案产品,输出多场景专业编辑应用产品。

美摄推出这款产品跟当下的视频领域发展趋势是分不开的。现如今随着长、短视频平台之间的竞争进一步加剧,中视频内容已成为平台的重点发力方向。中长视频对创作工具及场景的要求更为严苛,不同平台的风格调性也决定了创作者很难通过Pr、Final Cut Pro这样的传统视频编辑工具直接生产出所需内容,打造自有视频编辑工具是不少平台的选择。但PC端视音频编辑开发难度大,所需投入和后期维护成本过高。基于这样的背景,我们推出了美映PC版,助力平台快速搭建自有视频创作平台,构建系统化的产品生态。

LiveVideoStack:美摄科技的下一步规划是什么?重心会放在技术研发方面,还是在场景拓展方面呢?

侯康: 作为国家高新技术企业,美摄致力于成为全球最具影响力的智能视音频技术企业。美摄的核心研发团队在视音频领域有着丰富的研发经验,专注视音频引擎、图形图像处理和计算机视觉领域开发二十余年。与此同时,我们也在不断探索新的应用场景。去年我们在智能手机、智能硬件、广电及通信运营商等的基础上,成功将业务领域拓展到了智能汽车、智能穿戴等行业。

在我们看来,技术研发和场景拓展二者是相互促进的关系。领先的技术水平能够支撑我们开拓更广泛的应用场景,同时新的场景需求和应用中遇到的新情况、新问题也会促使我们不断提高技术能力。今年,我们推出了美映PC版、一键成片等多种新方案,能够适配更多应用场景,敬请期待。

LiveVideoStack:本次大会您将分享哪些精彩内容呢?您可以剧透一下吗?

侯康: 本次大会我将会分享美摄的汽车智能剪辑系统相关的解决方案,包括图像画质增强、智能视频剪辑以及虚拟场景娱乐三部分。

LiveVideoStack:好的,谢谢您接受采访,期待您在大会上的精彩分享。


采访、编辑:Teresa

▼扫描下图二维码了解音视频技术大会更多信息▼

对话美摄科技侯康:提升技术,拓展场景 美摄智能汽车视频处理方案已就位相关推荐

  1. 锂电产业技术创新大赛暨新能源智能汽车和动力电池前瞻技术项目路演预告

    9月2日至4日,中国国际商会将会同山东省贸促会.山东省能源局.枣庄市人民政府在山东省枣庄市共同举办首届中国(枣庄)国际锂电产业展览会.在此期间,枣庄市人民政府.国家新能源汽车技术创新中心将举办锂电产业 ...

  2. 怿星科技参加2022(第六届)高工智能汽车年会

    2022(第六届)高工智能汽车年会将于下周三在上海虹桥拉开帷幕,怿星科技作为本次活动的赞助商,将在11月30日下午的[座舱算力与系统]分论坛与大家分享关于智能汽车软硬分离探索与实践的专题演讲.此外,在 ...

  3. 美摄科技受邀LVSon2020大会 分享《AI合成虚拟人物的技术框架与挑战》

    摘要:作为智能视音频解决方案解决方案的服务商,美摄科技致力于为移动互联网.智能手机.智能硬件.传统广电及通信运营商等行业机构提供最前沿的整体视音频解决方案,为开发者与行业合作伙伴提供高效.稳定的底层技 ...

  4. 美摄科技X哔哩哔哩|“必剪”支持全面HDR,带来全新视觉体验

    随着越来越多的用户选择用视频来学习.娱乐与交流,视频化已经成为了"内容表达"的发展方向,字节.快手.腾讯等巨头纷纷进场占领高地,成千上万的MCN机构迎风生长.与此同时,作为视频创作 ...

  5. 智己汽车联手美摄科技深度合作Carlog车载摄像系统

    当前,中国智能汽车市场展现出了巨大的发展潜力.据<2022中国智能汽车发展趋势洞察报告>数据显示,预计到2025年,中国L2及以上智能汽车销量将突破千万辆,对应中国智能汽车渗透率将达到49 ...

  6. 美摄科技起诉天目传媒使用火山引擎侵权代码的声明

    此前,美摄科技发现由北京火山引擎科技有限公司.北京字节跳动科技有限公司共同开发.运营.销售的"智能视频创作SDK"软件(简称"VESDK软件")侵犯美摄软件著作 ...

  7. 美创科技深度参编的《数据安全治理实践指南(2.0)》发布

    1月5日,由中国信息通信研究院.中国通信标准化协会指导,中国通信标准化协会大数据技术标准推进委员会主办,数据安全推进计划承办的第二届数据安全治理峰会成功召开,多项数据安全研究重要成果发布. 会上,美创 ...

  8. 专访美创科技王利强:站在数字化转型的时代浪尖上,争做行业推动者

    "[报告下载]后台回复关键词"数据智能报告"可免费下载数据猿最新发布的完整高清版<2021中国数据智能产业发展报告> 大数据产业创新服务媒体 --聚焦数据 · ...

  9. 美创科技与联通(浙江)产互签署战略合作协议

    10月24日,杭州美创科技有限公司(以下简称:美创科技)与联通(浙江)产业互联网有限公司(以下简称联通(浙江)产互)在美创科技杭州总部签署战略合作协议.美创科技CEO柳遵梁.副总经理徐荣星.闻建霞.胡 ...

最新文章

  1. java 静态内部类
  2. spark编程mysql数据源_Spark - 直接操作数据源 MySQL
  3. 使用JAX-RS创建RESTful Web Service
  4. Quartus II sof文件转 jic文件
  5. 讲解ontouchstart、ontouchend、onclick区别和坑点
  6. 对于五个问题的思考与感想
  7. 如何发现 Redis 热点 Key ,解决方案有哪些?
  8. 金庸小说人物关系表年表
  9. C++中用new和不用new定义类的对象的区别解答
  10. 西南民族大学计算机考试试题,西南民族大学预科教育学院 2007级《计算机》模拟试题(含答案)...
  11. python pipline_python中sklearn的pipeline模块实例详解
  12. oracle—“操作记录已被里一个用户锁住” 解决办法
  13. 设计模式7------装饰者模式(Decorator Pattern)-------结构模式
  14. win下编译TNN安卓库(静态或者动态) + android studio ndk调用
  15. 实时翻译软件-大家都在用的实时免费翻译软件
  16. 电瓶车.20180804
  17. 3D模型【茶几垫子】
  18. jquery实现数字抽奖(版本2)
  19. 7-2 长度质量计量单位换算 (5 分)
  20. codeMirror 使用教程

热门文章

  1. 张帅用赢球庆生 搭档斯托瑟晋级澳网女双八强
  2. 综合学生信息管理系统(JSP+JDBC)
  3. 在2018年iOS应用程序发展趋势
  4. ASP.NET WEBAPI设计(文摘)
  5. 《Python数据挖掘:概念、方法与实践》——1.5节小结
  6. 读《嵌入式系统项目分析入门与实践》⑤
  7. 扩展的母函数(可以做减法的母函数)(当然只要你愿意也可以做乘除!)
  8. Quartz.Net使用总结
  9. 工具设置Unity3D系列教程--使用免费工具在Unity3D中开发2D游戏 第一节
  10. RHEL4- DNS服务(六)构建DNS缓存服务器