衡宇 发自 凹非寺
量子位 | 公众号 QbitAI

Hey Siri,请你告诉我,Siri算虚拟数字人吗?

Siri如何回答,取决于它对“虚拟数字人”如何定义。

虚拟数字人并非新鲜事物,虚拟偶像如洛天依等,在亚文化圈风靡已久。

近一两年间,伴随元宇宙概念兴起,虚拟数字人,这批元宇宙的原住民,愈发朝着智能化、精细化、多样化发展。

向前推进发展,虚拟数字人技术有哪些新趋势?这一元宇宙热度加持下的商业化应用,又有哪些落地挑战?

在CCF C³第十五次活动中,专家学者和行业大咖来到快手总部,就这些问题展开了深入讨论。

虚拟数字人走向“寻常百姓家”

细数普通人接触虚拟数字人的途径们,绕不开的就有快手。

上个月,快手面向全网推出“V-Star虚拟人计划”,引得狐璃璃、机灵小熊猫、万一、图南翼、M浔少鹿等虚拟主播入驻。

而快手自身,早于App内推出了快手虚拟演播助手,它是一款面向“中之人驱动”的虚拟数字人一站式工具。

“中之人驱动”意味着这个演播助手,背后依靠光学、惯性、摄像头等多种动作捕捉方式,驱动数字人进行直播,并配备了丰富的3D场景和特效。

快手Y-tech AI技术中心负责人万鹏飞介绍道,快手虚拟演播助手包含的虚拟世界互动玩法,可以让观众通过虚拟化身,“亲自”参与直播。

相对应的,不需中之人驱动的“老铁智播间”,就是一款自动化数字人直播互动和视频制作产品。

因为有数字员工、直播、天气播报等丰富的应用场景,又因虚拟数字人能7x24饱含激情地工作,增加了直播效率,也降低了运营成本。

万鹏飞

Streamlake(快手技术to B品牌)的数字人及XR解决方案在应用层的第三个模块,是移动端混合现实引擎

它让AR/MR效果在“寻常百姓家”成为可能,用户在普通手机上就能体验,且机型覆盖率远超苹果ARKit和谷歌ARCore,对用户终端很友好。

在三里屯、故宫、岳阳楼等街区和名胜古迹的各种空间尺寸下,用户都能体验AR/MR效果。

提升虚拟数字人的表现力

现如今,利用AR/MR效果,普通人能通过手机屏幕,看见攀爬、躲藏于三里屯标志性网红大楼的三只熊猫。

倒推20年——2000年前后,学术界已经有科研者们在探究虚拟数字人的奥秘。

据清华大学计算机科学与技术系长聘教授贾珈介绍,她所在实验室在虚拟数字人的细分粒度上,有四个不同角度和层面的研究。

贾珈
  • 虚拟脸像合成:已从早期规则驱动加参数合成,过渡到如今高精度数据驱动模式,提升了真实性和易用性。

  • 肢体手势的合成和算法:基于深度自注意网络的说话人肢体手势生成算法,并从多模态上下文生成更加自然、更具有表现力、和语义相关性更强的手势动作。

  • 基于人类编舞单元的自动舞蹈合成:数据驱动(3D舞蹈动作数据集)和知识(编舞知识数据集)相融合,可拓展研发面向不同对象的交互应用。

  • 基于情感类别的可控情感语音合成:多维说话人属性驱动的语音生成,让虚拟数字人的声线更加贴近形象和人设,从而提升表现力。

虚拟数字人,到底什么样?

回到最初的问题,Siri到底算不算一个虚拟数字人?

圆桌讨论上,中国信通院云计算与大数据研究所内容科技部副主任石霖和快手研究员施侃乐都给出了否定的答案。

石霖(左),施侃乐(右)

石霖认为,虚拟数字人最终要落点在“人”之一字上,也就是应具备人形。在他眼中,数字人应具备科幻色彩,以区别传统意义上的“人”,同时要具备智能化的交互功能和个性化色彩。

施侃乐自称虚拟数字人的原教旨主义者。他将虚拟数字人定义为“我自己”在虚拟数字空间中的残余,故而虚拟动物只能称为虚拟形象,而非所谓的虚拟人。

虽然人人都已经在生活中或深或浅地接触,但在这背后,发展虚拟数字人技术,并非没有待突破的技术难点。

无论是交互能力、对端侧的渲染支撑、内容安全、表情精细化,还是虚拟数字人的应用场景和业务能力,都还有很长的路要走。

中国人民大学高瓴人工智能学院长聘副教授宋睿华发表了自己的看法。

宋睿华

她觉得,在离开“中之人驱动”之后,目前的虚拟数字人缺少人类的“魂”,在人机交互方面不能像真人一样,给予对方实时的反应。

北京中科深智科技有限公司联合创始人、CTO宋健从产业发展的角度表示,目前虚拟数字人面临的阻碍或挑战,不仅存在于软件等工具层面。

伴随虚拟数字人产业的扩大,标准化、安全问题、规模化等问题都会逐渐显现,并亟待解决。

宋健

那么,现在的虚拟数字人发展处于什么水平?

有意思的是参与圆桌讨论的产业界人士一致认为,目前处于虚拟数字人发展早期,技术度较低,市场渗透率和知名度也不高,总体在探索尝试阶段;

学界两位嘉宾则有同样的看法,即虚拟数字人已经路过了过高期望的峰值,正走向泡沫化的低谷期

嘉宾们还对虚拟数字人的最终形态各抒己见。

有人认为,未来的虚拟数字人应与机器人合二为一;也有人发表看法称,它应当是数实相生的人类未来伙伴。

而要走到这一步,道阻且长。

CCF C³

以上精彩内容,全部出自CCF C³的第15期活动,主题为“虚拟数字人”,由快手承办。

CCF将在2024年横店落地一座计算机博物馆,能够实地体验虚拟数字人技术。

C³活动是由中国计算机学会CCF CTO Club发起的,旨在联结企业CTO及高级技术人才和资深学者,每次以一个技术话题为核心,走进一家技术领先企业。

目前为止,CCF C³已先后走进京东、小米、搜狗、百度、亚马逊、阿里巴巴、联想、OPPO等企业。

Siri算数字人吗?清华人大教授、初创公司CTO、 产业专家与快手工程师一起说|CCF C³...相关推荐

  1. 元宇宙iwemeta:元宇宙数字人实践落地应用场景

    把虚拟数字人装进你的手机!百度.腾讯.讯飞盯准这条新赛道. 短短三个月内,几乎每一家拥有智能语音技术能力的大厂都在采取行动布局虚拟数字人. 百度.华为.阿里等都纷纷引入AI数字人入职,担任技术宣讲员. ...

  2. 直播预告:PBRMAX标准与超写实AI数字人

    本次直播,我们邀来南京万生华态EcoPlants CEO彭程,为大家分享PBRMAX标准与超写实AI数字人中的相关内容. 直播中还会为Renderbus瑞云渲染影视动画用户的年中充值抽奖活动开奖!英伟 ...

  3. 12张PPT看懂中国虚拟数字人产业现状:应用不止于虚拟偶像,2030年市场达2700亿|量子位智库(附下载)...

    荣伟 发自 凹非寺 量子位 报道 | 公众号 QbitAI 这位小姐姐,真不是人. 仅仅出道一年,已经拍了VogueMe杂志,上了央视综艺,还接了特斯拉的代言. (卑微的打工人看着她的履历,流下了委屈 ...

  4. 在手语世界里,健听人、数字人与听障人的交织

    如果没有声音,我们的世界会变成怎样的呢?没有雨落地,风吹草,鸟鸣啼:各种娱乐节目和直播也会远去:更麻烦的还在于,常规教育接受也会成为问题,读书识字可能会变成一种奢侈,网课.视频课都可能远去.这些问题对 ...

  5. AI为方,产业为向:京东云数字人的技术攀爬

    今年11.11正如火如荼进行中,各大平台的直播间,大家可能已经发现了一群新面孔--数字人主播.电商直播作为越来越强大的流量入口,几乎已经成了零售品牌和商家们的必争之地.而高昂的坑位费.主播参差不齐的业 ...

  6. 沉睡者 - 百度推出可24时直播带货的AI虚拟数字人

    百度推出可24时直播带货的AI虚拟数字人 前几天我还说做直播太内卷,运营成本太高了呢,今天百度就推出了AI数字人,同时推出了曦灵数字人直播平台.它最大的特色功能就是: (1)有基础文本,就能生成一条字 ...

  7. 直播24小时不间断:百度智能云将推出AI超高精数字人

    据悉,在7月21日百度世界2022大会上,百度智能云将推出数字人直播平台,可实现超写实数字人24小时纯AI直播,支持随意切换妆发.服装.场景. 相比真人主播,数字人直播可降低人.时间.空间的限制,无需 ...

  8. 香港中文大学(深圳)韩晓光教授招收三维数字人方向博士生

    来源:AI求职 香港中文大学(深圳) 香港中文大学(深圳)是一所经国家教育部批准,按中外合作办学条例设立的大学.大学传承香港中文大学的办学理念,优良学术传统,以"结合传统与现代,融会中国与西 ...

  9. 搜狗联合清华天工研究院推出ChoreoNet模型:让数字人随着音乐翩翩起舞

    声音与AI行为搭配在一起,会发生怎样的化学反应呢?这一话题,正在成为国内外AI研究比较热衷的新方向. 比如卡内基·梅隆大学和CMU机器人研究所,就在研究声音和机器人动作之间的相互作用:国内则从数字人入 ...

最新文章

  1. 警惕企业中的五种虚假执行力
  2. Oracle bootstrap$ 详解
  3. python、numpy,keras,tensorflow等函数用法积累(持续更新)
  4. .jar中没有主清单属性_面试官问:为什么SpringBoot的 jar 可以直接运行?
  5. wxHtml 示例:帮助测试
  6. 扒一扒.NET Core的环境配置提供程序
  7. CSS命名规范(建议版)(转)
  8. python函数装饰嵌套_python3--函数名本质,函数嵌套,闭包,装饰器
  9. IOS开发之----四舍五入问题
  10. Gns3模拟器配置Cisco ASA防火墙
  11. usb加密狗破解软件
  12. 计算机二级是高级应用,计算机二级考试之office高级应用
  13. 智慧楼宇篇 6 —— 室内定位技术(五) - 室内定位技术总结
  14. C/C++之内存调试工具GDB与Valgrind
  15. html如何设置展开全文,Js实现点击查看全文(纯手工代码)
  16. 架构师的工作都干些什么?!想做架构师必看
  17. 第六节 交叉分析和非参数检验
  18. UA OPTI544 量子光学1 Maxwell方程与Lorentz Oscillator回顾
  19. 创业者面对困难-不轻言放弃
  20. kali linux基本口令_kali linux 新手入坑指南(命令篇)

热门文章

  1. 投屏为什么显示无法连接服务器,乐播投屏为什么连不上? 乐播投屏无法连接如何解决?...
  2. 如何取消 文件夹在TabX中打开
  3. css 页面从左侧向右滑入,动画只执行一次
  4. 模型剪枝学习笔记--SlimYOLOv3:Narrower,Faster and Better for Real-Time UAV Application
  5. 局域网 二维码fe分享图片 (带密码验证)
  6. c++ 实现c#的int.TryParse。
  7. Vue 全家桶实现一个移动端酷狗音乐
  8. Jmeter实现并发测试
  9. 天纵智能软件快速开发平台日程安排插件
  10. 第八章(无人售货机零售项目实战)