点击上方“Python与机器智能”,选择“星标”公众号

第一时间获取价值内容


郭一璞 发自 凹非寺
量子位 报道 | 公众号 QbitAI

人工智能技术,现在可以实现自动剪视频了。

只要有一篇现成的图文链接,AI就可以根据图文描述的主题,重新组织语言,自动搜寻素材,剪出一条短视频。

换句话说,如果看到有意思的新闻却懒得读文章,那就把你在读的这篇文章的地址输入给AI,文章就自动变成了短视频。

而且,这个过程只需要几分钟的时间,完全无人化自动操作,你下楼买了杯咖啡,视频就自动做好了。

这个“AI做视频”技术来自百度研究院,产品的名字,叫做VidPress。你看,它可以自己做一条视频,来报道自己的出生:

看起来就像正常的电视新闻一样。这下,视频编辑们再也不用为了搜素材、改脚本、加特效、渲染导出而加班熬夜了。

做视频的AI

本质上,VidPress是做的事情是“图文转视频”,把人类写好的图文稿件重新编辑成视频,可以参考一下上面视频内容的原文:

比较之下,你会发现视频和文章的文案部分都是类似的,但视频中用到的素材却远不止文章中这么少,增加了许多人物和场景的动态镜头,而且相当契合主题。

那一定是用语音合成做了配音部分,然后视频编辑随手搜了几个视频素材放上去了咯?

非也。整个视频都是AI生成的,视频编辑只需要给出一篇文章的链接,过几分钟,热腾腾的视频就出锅了。

不信往下看。

只要有链接,视频自动生成

用VidPress来做视频,不需要视频编辑有任何技术背景,会复制粘贴就行。

首先,把需要改成视频的文章地址复制,粘贴到VidPress。

然后,选择用哪个声音合成,确定所需视频的长度以及分辨率。

现在,视频编辑就可以放手让AI开始工作了。

获得图文内容后,AI会借助NLP模型进行语义理解,用主题模型聚合相关新闻和素材。

之后,需要分别完成音频和图像的编辑工作。

音频方面,系统会用多种语言模型处理解析原文,生成解说词,之后借助语音合成技术变成音频。

而图像方面,原文中的图片肯定是不太够的,需要再搜寻更多视频和图片素材。素材的来源可以是视频编辑自己的素材库,也可以直接实时的用百度搜索来找素材。

找到素材后,需要借助人脸识别、物体识别、OCR、视频内容理解等技术来解析理解视频素材的内容,自动剪切选取合适的片段。

有了视频素材和解说词音频文件,需要把两者合二为一。在这个任务上,百度自研了两代对齐算法,第一代对齐算法是基于段落的对齐,第二代则是基于锚点的时间轴对齐算法。

第二代对齐的算法首先需要找出解说词里观众的兴趣点,然后再将搜到的素材和这些兴趣点,进行相关度打分,综合考虑素材的来源、相似度、图片/视频内容的贴合度、内容质量等方面。

之后,得分高的素材就率先被翻牌子,放到视频时间轴里兴趣点的位置。而剩下的素材就会被填充到空隙里,最后再对整个时间轴的内容分布进行调整。

现在,AI就把视频做好了,渲染一下,就是一个完整的视频。

这个过程只花费几分钟后。当编辑再次切回VidPress页面,视频已经自动生成好了,还自动配好了字幕。

之后,编辑也可以人工修改。如果觉得某一部分的文案不够好,可以替换编辑成所需的文案重新导出视频。

胜在速度

诚然,VidPress目前还无法完成真人视频博主那样专门策划拍摄的短视频作品,但是如果用来做新闻简讯类视频,那VidPress的水平已经足够实现商业应用了,除了没有真人播音员,做出来视频的样子和以前的电视新闻节目十分类似。

但是它胜在速度太快,生成一条视频可能只要十几分钟,而其中一半的时间都是AI在自动工作,人类视频编辑只要粘贴链接,设置好声音时间分辨率就行了,再也不用苦苦守在电脑前剪视频了。

可以说,用这种方式来工作,做视频的时间比往各个平台发视频的时间都短,以前一小时的工作,可能现在10分钟就能完成,再也不用加班熬夜,短视频编辑们要笑着迎接955了。

有了这样的剪辑效率,当瓜来了的时候,别的编辑还在哼哧哼哧找素材剪视频,用VidPress的编辑已经做好了视频,发给了吃瓜群众,还没等撤热搜就可以收获10W+,美滋滋。

目前,VidPress生成一个2分钟左右的720p视频, 所需时间的中位数仅为2.5分钟。

而在百度好看视频内部,整个平台每天可以生产500到1000条视频,而且这些视频所围绕的新闻热点都是系统自动发现、自动生成的。只要服务器在跑,即使躺在家里,平台上就会有源源不断的视频出现,并自动分发给观众。

如此高的生产效率,简直是短视频领域的一记惊雷。

如今短视频火得一塌糊涂,正处红利期,无论是腾讯、头条还是百度自己,都在争相自研或投资短视频平台,这类工具一旦开放,会是大大小小创作者、MCN们争抢市场的巨大机遇,AI制造的短视频,会像当年的中国制造一样,涌入各个视频平台,成为新的一波流量收割机。

毕竟,图文内容的生产成本,可比视频内容低得多,只要写好文章,分分钟就会有配套的视频出来,同一份辛勤,收获多几倍的流量,那么至少在目前阶段,这类AI生成视频就是触手可得的红利。

或许不久之后,大家就可以看视频版的量子位了呢。

传送门

目前,VidPress平台可以申请试用,申请链接:

https://ai.baidu.com/creation/external/labprojectlist

如果你对VidPress还有其他想了解的地方,可以通过这个邮箱联系他们的工作人员:

vidpress.support@baidu.com

-结束-

???? 长按识别,即可关注

好文章,我  在看 

我什么都没做,文章就自动变成了视频?AI神器解放视频编辑丨百度研究院出品...相关推荐

  1. 阿里技术大神:你没做错啥,你错在啥都没做

    难受,那是因为你正在爬坡,正在成长 你有没有想过,如果你现在做的工作,能看到你10年后的样子,你愿意吗? 领着固定薪水,做着熟练到形成肌肉记忆的事情. 有一天,在舒适区里呆得太久,想跳出来,发现已经没 ...

  2. printf打印结构体_工程师:这道题80%初学者都没做对!你确定搞懂结构体内存对齐了?...

    这是工程师面试后的实际经历-- 这道经典.易错的关于C语言结构体内存对齐的题目,你真的会吗: 求32bit环境下以下结构体所占的字节数:typedef struct test_struct{ char ...

  3. 为什么你从来没做过发起人?

    读MBA的时候,曾经听过一堂创业课,是一个来自MIT创业研究室的资深教授的课. 当时我正在筹备自己的第一个公司,举手提问,大概是问 "怎样才能确定自己是不是一个好的创业者". 教授 ...

  4. 任正非回应华为偷窃美国技术:美国都没做出来 我去哪里偷?

    [TechWeb]5月27日消息,华为创始人任正非日前接受外媒采访时,回应了华为偷窃美国技术的说法.他表示,美国都没做出来,华为去哪里偷. 华为 外媒主持人问道,华为的批判者认为,华为的发展成就是靠盗 ...

  5. 领英常见问题-刚注册的领英账号什么没做就封号了?

    使用领英有一段时间的人肯定遇到过这种情况.新注册的领英账号什么都没做就 给封号了,重新注册后又封号,不管注册多少个账号都是这种情况.这时很多人会感 觉很无奈,不知道是什么原因封号的. 领英精灵-注册 ...

  6. 【阿里21校招笔试题】【日常生活】【BUG日记】我真是个呆瓜!居然不会写冒泡排序了,我吐了!结果阿里的校招笔试题一题都没做好!!!我人真的傻了!就卡在排序上!!!

    [记录]:记录一次呆瓜日记,自己真是一个大傻子. [经过]:今天晚上在做阿里校招的笔试题的时候,我人傻了.固定一个小时,做两道编程题,结果第一题都没做完. [题1]:(只记得大概需求)输入一个数n,再 ...

  7. 【转载】突然觉得今年的时间过得太快了,不知不觉中还剩下四个多月就步入2017年了,回首一下,好像什么都还没做呢。...

    2019独角兽企业重金招聘Python工程师标准>>> 突然觉得今年的时间过得太快了,不知不觉中还剩下四个多月就步入2017年了,回首一下,好像什么都还没做呢. 在职场的时候,天天盼 ...

  8. 改做人工智能之前,90%的人都没能给自己定位

    本文来自作者 章华燕 在 GitChat 上分享「转行 AI,如何给自己定位?」,「阅读原文」查看交流实录 「文末高能」 编辑 | 奕迅 1. 为什么人工智能如此之火 众所周知,互联网行业的变化快到让 ...

  9. 计算机保存图片找不到桌面,电脑从做系统图片都没了-为什么保存在电脑的图片,找不到?...

    电脑知识网 2021-06-21 3 次 笔记本做系统后 电脑的照片没了 如何找回?可恢复上个版本么? 题主应该是装新系统的时候把硬盘重新分区了,或者原来开不了机的系统就只有一个分区,导致所有文件被格 ...

最新文章

  1. 把委托说透(2):深入理解委托
  2. 验证中文的正则表达式
  3. 【飞秋】网络的基础-域名篇
  4. 自学Python编程和科班出身的Python编程差别在哪?一张图告诉你
  5. 3种双集群系统方案设计模式详解
  6. python面试题之如何用Python输出一个斐波那契数列
  7. URL报错: unknown protocol
  8. 迷你MVVM框架 avalonjs 学习教程6、插入移除处理
  9. HDU5667 - Sequence 矩阵快速幂 + 费马小定理
  10. 企业微信本地测试环境搭建
  11. 错误码 0x8007007b 解决
  12. Web安全——同源策略理解
  13. 文件服务器如何异地备份,实战演示如何进行异地自动备份数据库
  14. OSPF学习小结与实验
  15. Station M2极客主机
  16. mysql 军规_MySQL数据库军规
  17. html5支付成功页面,订单完成页面视图《 微信支付:H5 移动端支付 》
  18. 计算机学院篮球队介绍,计算机与信息学院男子篮球队荣获“抗疫杯”校篮球赛冠军采访纪实...
  19. ASCLL码---阿斯科2码
  20. 14.1 常见数据结构、List集合(ArrayList、LinkedList)、Set集合(HashSet、LinkedHashSet)、可变参数方法

热门文章

  1. 欧拉回路基本概念及定理
  2. 我在车间写代码:我的代码能省1个亿
  3. LeetCode Scramble String
  4. 超经典超好玩的光枪游戏,强烈推荐!
  5. Java并发,volatile+不可变容器对象能保证线程安全么?!
  6. 2016年云安全调查报告(更新版)
  7. 纯数学教程 Page 325 例LXVIII (13)
  8. 自己动手写操作系统-实践
  9. pytorch 神经网络训练注意最后一批次输出的数据体量
  10. tensorflow2.0中valid_data的作用是在训练的过程对对比训练数据与测试数据的准确率 损失率,便于判断模型的训练效果:是过拟合还是欠拟合(过拟合)