NEW

关注Tech逆向思维视频号

最新视频→【最骇人的5起自动驾驶“杀人”事故】

来源|智能车参考

文|贾浩楠 韦丽雪 褚万博

全球最快的AI训练速度王座,刚刚易主了。

不是英伟达GPU,也不是谷歌TPU……

马斯克治下的特斯拉,自研AI训练芯片D1,自研AI超级计算机Dojo ExaPod,首秀即巅峰,登场就是全球第一。

此外,马斯克还带来了另一个特斯拉新品:

汽车机器人,搭载了特斯拉包含芯片在内的软硬件系统,但跟百度的不同,不像汽车更像人。

这就是特斯拉年度AI开放日上,马斯克再次带来的一系列激动人心的大进展。

01

特斯拉自研AI训练芯片D1发布

马斯克说:要有一个超快的计算机来训练Autopilot在内的整个自动驾驶系统。

于是DOJO诞生了。

DOJO,取名源自日语里“练武”专用的道场,顾名思义,DOJO就是特斯拉AI不断精益功夫的道场。

DOJO 是一种通过网络结构连接的分布式计算架构。它还具有大型计算平面、极高带宽和低延迟,以及分区和映射的大型网络。

实际上,在CVPR 2021现场,特斯拉就已经剧透过DOJO的相关性能。

当时总算力达1.8EFLOPS,读写速度高达1.6TBps,一度被认为超越全球排名第一的超级计算机富岳,创造超算新纪录。

但那时DOJO用的是英伟达的A100 GPU,单卡算力321TFLOPS,共计5760张,节点数高达720个。

而现在,DOJO更进一步,自研了“心脏”芯片

特斯拉首款AI训练芯片D1,正式发布。

7nm工艺,单片FP32达到算力22.6TOPs,BF16算力362TOPs。

特斯拉发布会现场,还用图展示性能,拳打英伟达GPU,脚踢谷歌TPU。

一句话概括,比现在市面上任何芯片都强。

特斯拉也用“Pure Learning Machine”,纯学习机器,来称呼D1芯片。

此外,D1芯片强的不只是单兵作战能力,还有集团军作战能力,它们可以无缝融合,变成超大规模计算阵列。

能有多大,接下来,特斯拉就揭晓了之前预热海报上的“神秘物种”:

集合了25块D1芯片的训练模块!

这也是特斯拉首个训练模块,而把多个模块集合,就能形成更大算力的训练阵列:

至此,特斯拉自研超算DOJO完整真身亮相!

超过50万个训练节点。每个模块算力为9 petaflops,带宽为36TB/s。

DOJO的可怕之处在于,不同于世界其他超算需要承担多种不同任务,DOJO的唯一使命就是AI训练,或者可以说聚焦到自动驾驶算法的训练。

因为专注,所以首秀即巅峰。

AutoPilot、FSD,特斯拉的其他AI训练任务,都能在DOJO里更高效练就。

另外,特斯拉官方还继续剧透:这不是终点,下一代DOJO还会有10倍性能的提升!

所以到这里就完了?拿衣服。

最后也是最强,特斯拉D1支持下的终极大杀器登场:

ExaPOD,集成120个训练模块,包含3000个D1芯片,超过1百万个训练节点。算力达到1.1EFLOP

而且每单位能耗下的性能比当今最强超算高1.3倍,但碳排放仅为1/5。

速度和性能,冠绝业内。

于是特斯拉明确:这就是全球最快的AI训练计算机。

有意思的是,2019年美国能源部曾放言要花6亿美元建E级算力的超算,2023年问世……

万万没想到,这个目标被“车企”特斯拉率先实现了。

02

最强“炼丹炉”为谁而建?

所以问题来了,自研D1芯片有了,最强AI训练超算DOJO ready了,接下来特斯拉会有怎样的改变?

特斯拉AI技术主管Andrej Karpathy(李飞飞高徒)登场,介绍了D1芯片和DOJO,主要服务的对象——特斯拉的在自动驾驶方面领先所有对手的“灵丹妙药”:

纯视觉方案。

事故频出,争议四起,甚至中国绝大部分玩家都转向了视觉+激光雷达的综合方案,但特斯拉依然坚持。

Karpathy详细介绍了特斯拉高纯视觉方案的思路,和现行8摄像头方案的特点,以及它为什么能work。

特斯拉纯视觉方案,基本构建原则是把自动驾驶系统看作一个生物,有眼睛、有神经、有大脑。

目前的方案有八个摄像头,背后是被称为HydraNets——“九头蛇网络”的多任务学习神经网络。

“九头蛇网络”可以同时处理目标检测、交通标志识别、车道预测等等任务,其关键在于对各种数据的特征提取,包括不同种类数据的特征共享、对不同任务的分别调参,以及参数缓存,用来加快调参速度。

这也是实现FSD敏捷开发,半年内迭代2-3个版本的关键。

接下来,Karpathy 描述了纯视觉方案的历史,以及方案发展到今天的逻辑,他展示了一段特斯拉处理其图像数据的视频。

他说过去 的FSD 虽然很好,但事实证明这样的系统不够完善,每个摄像头能够检测到工程师预期的目标,但背后神经网络的矢量空间是不够的。

于是,特斯拉如重新设计了神经网络,就是上面的“九头蛇”。

另外相机校准、缓存、队列和优化等等环节都做了最大程度简化。

特斯拉方面还比较了多摄像头方案和单摄像头方案的差别,相同的场景下,单摄像头方案识别率明显低于多摄像头方案。

特斯拉车辆上的8个摄像头获取原始输入后,系统会创建各种分辨率的图像,用于各种功能和目的。

这些不同的图像会被分别喂给处理不同任务的神经网络,作为整个自动驾驶系统的决策依据。

接着,Karpathy介绍了特斯拉的“终极建筑师”,即车辆在行驶过程中可以实时对车道、环境建模。

车道线实时建模,其实就是特斯拉自己的高精地图能力。

中国自动驾驶玩家,强调“高精度地图”的不少,但特斯拉的思路,“现成资源”不是本质能力,本质能力应该是“创造资源”的能力。

最后,Karpathy谈了AI公司常见的数据标注问题,他认为,把数据外包给第三方去做手工标注并不好,所以特斯拉选择自建团队来给数据打标,目前已经从2D图像标记升级到4D矢量空间的标记。

这也是特斯拉自动驾驶不断快速进化的核心所在。

依靠人工标注,显然无法应对量产车上路后的大规模数据,所以只有自动化标注,才能形成数据闭环。

开放日上,特斯拉也展示了如何从车道线、2D图像……一点点跃迁至4D标注和建模的。

行人、车辆、树木,建筑物……清清楚楚,而且还有意图识别。

特斯拉方面也强调,基于类脑一样的感知系统、自动化标注能力,以及仿真,确保了特斯拉为什么可以基于纯视觉实现更高维度的自动驾驶。

仿真,简单讲就是利用现实数据,将真实世界的实时动态景象,在计算机系统实现重新构建和重现。

这套模拟程序,用特斯拉的话说,就是一个以自动驾驶为玩家的视频游戏。

在这套系统里,任何要素都可以被添加其中,包括奇葩的极端场景。

比如这里,人太多导致目标难以标注,车辆极多:

特斯拉这里还不忘补刀一下毫米波雷达——纯视觉也能做很好,所谓的雷达冗余作用有限。

特斯拉方面还披露,现在标注和仿真系统,可以模拟数量高达3.71亿的数据及场景。

当然,自动驾驶最后还得解决从比特世界走向原子世界应用的问题。

这次特斯拉主要披露了控制和规划方面的进展。

特斯拉自动驾驶总监Ashok Elluswamy,分享了特斯拉针对复杂场景的规划方案——“混合规划系统”。

主要思路和技术方法是基于蒙特卡洛树搜索,实现最佳路径规划。

最后,整个特斯拉自动驾驶从感知到决策规划,一图概括如下:

03

One more thing:特斯拉“机器人”

最后的最后,就在大家都以为发布会完全就是自动驾驶相关内容之际……

“简短茶歇”环节,竟然来了一段“机器人热舞”——宛如衣服Model一样的穿着,样子非常“硅基”。

这是特斯拉的行为艺术?

不不不,再次出乎意料。

马斯克再次登台,然后郑重其事发布:特斯拉机器人。

身高5英尺8英寸,约为172cm;重量125磅,约为56.7kg;承载能力为45磅,约为20kg。

它的面部是一个显示屏,用来显示重要信息。

从外形上看,四肢和人类一样。

为了实现平衡性和敏捷性,四肢使用了40个机电推杆。

同时,特斯拉各项AI和芯片技术,都会应用其中。

比如使用Autopilot的摄像头充当感知系统,胸腔里内置特斯拉自研芯片——FSD同款,还会加持多项特斯拉已开发出的技术,如多摄像头视频神经网络、规划能力、标记。

而且马斯克强调,这不是玩具周边,它会最终实现——可能明年就会正式推出,这是特斯拉电动车的下一步。

硅谷钢铁侠还说,他会是一个非常有用的机器人,由人打造,为人服务,而且会确保一直对人友好,能把人从危险的、重复的,无聊的任务中解放出来。

甚至还能跟已经高度自动化的特斯拉车辆生产进一步结合协作。但按照马斯克的意思,首要的应该是“做家务”。

有意思的是,随着特斯拉这个“机器人”发布,太平洋两岸都把“机器人”作为了智能车变革的下一步。

中国这边,百度李彦宏刚刚推出了一款“汽车机器人”,不过更像“汽车”而不是“人”。

美国那头,马斯克的特斯拉机器人,更像“人”而不是“汽车”。

这种区别,也可能跟马斯克的那个江湖绰号有关。

伊隆·马斯克,不就是现实版钢铁侠吗?


关注剁手日记视频号

最新视频→【荣耀Magic3系列体验:大爱3D LUT 我愿称之为手机影像革命】

RECOMMEND

网易智能有12个不同垂直领域社群等你来

添加智能菌微信:kaiwu_club

扫码了解更多

马斯克发布机器人,“钢铁侠”那种!特斯拉推出全球最快AI计算机,自研芯片那种...相关推荐

  1. 华为推出全球最快AI训练集群Atlas 900,算力超群

    9月18日,华为全联接2019(HUAWEI CONNECT)大会上,华为副董事长胡厚崑发布了Atlas 900 AI训练集群,以超强算力带给企业人工智能业务的极致体验.世界正从数字化向智能化转型,人 ...

  2. eyemore发布全球首款AI视觉专用成像芯片,能否助推AI视觉产业跃迁?丨Xtecher 观察

    继美国的柯达.日本的索尼之后,中国的eyemore希望在AI时代扛起前端成像革命的旗帜.其发布的全球首款AI视觉专用成像芯片--eyemore X42,恰好填补了国内AI视觉的领域的空白,成为助推AI ...

  3. 2023年推出的iPhone15将使用苹果自研芯片?能行吗?

    不知道大家有没有发现,近年来苹果的更新速度好像变快了? 新闻不断.升级不断,从而让苹果始终活跃在人们的视野之中,而在这其中,最引发人们话题讨论的永远是芯片. 芯片作为互联网科技发展的一个重要侧重点,一 ...

  4. 马斯克发布机器人,何小鹏牵出机器马,现在造车哪还有「车的样子」

    ‍‍ ‍‍ NEW 关注Tech逆向思维视频号 最新视频→[网红饭店接连翻车 过期食品的危害有多大?] 出品|智能车参考 文|雷刚 你以为的车企,不再是你以为的车企. 这不,特斯拉刚刚轰动的AI开放日 ...

  5. 重磅 | 华为发布绝杀计算战略!投15亿美元打造开放生态,全球最快AI训练集群Atlas 900,绝了!...

          戳蓝字"CSDN云计算"关注我们哦! 文 | 阿晶.丹丹.王银发于上海华为HC大会现场 出品 | CSDN云计算(ID:CSDNcloud) 科技的不断发展正逐步加速智 ...

  6. 诺基亚推出全球最快路由器 瞄准苹果等网络巨头

    6月15日消息,据路透社报道,诺基亚周三推出了全球最快的网络芯片,从而打入了瞻博网络(Juniper)和思科主导的核心路由器市场,并有助于促进其现有的网络业务. 这家芬兰公司表示,其新推出的路由器可以 ...

  7. 特斯拉在中国凭什么翻身?自研芯片还是自动驾驶?

    数据智能产业创新服务媒体 --聚焦数智 · 改变商业 从特斯拉公布的2021年Q2季度财报来看,无疑,特斯拉再次印证了自己的盈利能力.财报显示,Q2季度非GAAP准则下净利润高达 16亿美元(103. ...

  8. Meta为元宇宙建全球最快AI超算,1.6万个A100 GPU,英伟达都赚麻了

    晓查 发自 凹非寺 量子位 | 公众号 QbitAI 今天,扎克伯格宣布,Meta要建造全球最快的AI超级计算机,而且就在2022年年中建成. 这台超算被命名为"AI研究超级集群" ...

  9. 诺基亚推出全球最快路由器 与思科争夺苹果等巨头订单

    据路透社北京时间6月15日报道,诺基亚周三发布了号称是全球速度最快的网络芯片,进入目前由Juniper和思科主导的核心路由器市场,同时加强该公司现有的网络业务. 诺基亚表示,这种新型路由器可以处理虚拟 ...

最新文章

  1. HDU2066(Dijstra算法)
  2. SASS初学者入门(转)
  3. Python环境的安装
  4. python安装卡在core inter_python – 如何在我的机器上安装numpy / core ...
  5. mysql 日期类型比价_MySQL 日期时间类型怎么选?
  6. 安卓监听软键盘搜索键
  7. 发明了计算机科学中的 bug 一词的是,为什么经常把计算机中存在的问题叫bug?...
  8. flex 发送到java_(转)java与flex通信
  9. es elasticsearch-head安装
  10. jquery radio,select相关操作
  11. 计算机病毒鼻祖拟推新型搜索技术挑战谷歌,美科学家将推新型搜索引擎挑战谷歌...
  12. 新浪微博生成超短链接
  13. 【OMNeT++】ALOHA协议仿真中的channelUtilization
  14. Noip 2016 蛋碎一地晚节不保
  15. 英语专业跨计算机考研方向,对于一些英语专业考研有哪些的选择方向
  16. 建模实训报告总结_模型实训心得体会
  17. div绑定onblur事件
  18. 《金牌网管师——助理级网吧网管》目录
  19. 相同的js文件在IE浏览器可以响应,但是在Chrome浏览器上没有响应
  20. qurlinfo在qt5中_QT5编译使用QFtp的方法步骤

热门文章

  1. android动画sin cos,Android开发中计算器的sin、cos及tan值计算问题分析
  2. 2022年辽宁省安全保护服务人员(初级保安员)考试练习题及答案
  3. 华为鸿蒙无gms,一夜之间,鸿蒙没有替换安卓,但华为HMS真的替换了谷歌的GMS
  4. 初识HTML(二)VsCode编辑器,常用标签
  5. 系统计算机如何使用记录,Win7如何查看电脑使用记录?
  6. IntelliJ IDEA开发最佳配置(已更新至2022版)
  7. win10/win11自带的截图和剪贴板快捷键,摆脱第三方截图工具的烦恼
  8. android转场动画效果,Android转场动画
  9. Android开发之调用摄像头拍照(Android 第一行代码)
  10. 文件上传漏洞小结与Upload-labs 靶场纪实