公众号/机器之能
Dojo神经网络训练计算机的目标是以更低的成本实现性能提升一个数量级。这也是掌握全球70多万台特斯拉汽车数据公司的必然选择。在马斯克的规划中,为处理海量视频数据而研发的Dojo超级计算机很可能会在一年后完成第一个版本。
撰文 | 吴昕、力琴
马斯克一直在死磕「全自动驾驶」。
「我觉得我们已经非常接近L5级自动驾驶了。我有信心,我们将在今年完成开发L5级别的基本功能。」在7月的世界人工智能大会上,马斯克曾高调表示。并随后在特斯拉第二季度财报上声明,公司正努力转向更复杂的人工智能框架,以提高 Autopilot功能。
言犹在耳,另一边,一辆特斯拉就在美国撞上了警车。不过,这并不妨碍马斯克为自己心爱的性能怪兽项目在线招新。
8月15日,马斯克发推特表示,特斯拉正在为名为「Dojo」的神经网络训练计算机项目「招兵买马」,招募AI或芯片人才。
目前,Tesla Autopilot 团队已经拥有超 300名有才能的工程师,其中软件工程师大约200名,芯片工程师100名。
众所周知,特斯拉一直使用摄像头来检测汽车和行人的存在,而不是激光雷达。
目前,大约有75万辆特斯拉汽车在世界各地运行,这些车带有8个环绕摄像头。以用户平均每天可能会开车约一个小时计算,这支庞大的车队每月会产生约2000万小时的360度视频,每辆车8个摄像头,车队每月大约会产生1.7亿小时视频。让人工标注视频不仅困难,在经济上也不可行。因此,让数据学会自我监督将大大提升数据处理效率。这也是为什么马斯克对超级计算机寄予厚望的原因。
2019年11月,特斯拉的AI高级总监Andrej Karpathy 在一次演讲中透露,Dojo训练计算机的目标是以更低的成本将性能提升一个数量级。
目前,Dojo仍在建造中,从V1.0开始,可能大约一年后才会有结果。
这将是一台真正的超级计算机,马斯克在推特上表示。从技术上讲,还有很多工作要做,「我们已经以约0.01%的负载在 FPGA 上模拟过这台超级计算机的运行。」
根据马斯克本人在推特上的说法,将在「六到十周内以有限的公开发行形式」提供这项技术,这将成为特斯拉在自动驾驶系统里的一大进步。
马斯克解释Dojo为什么会是一头性能怪兽。
以约0.01%的负载在 FPGA 上模拟运行这个超级计算机。
在此之前,关于 「Dojo」 ,目前披露的消息并不多。马斯克提及这个项目主要集中在两次公开场合。
2019年8月4日,马斯克在推特上称,「Dojo将给自动驾驶技术带来不同。」在7日召开的特斯拉投资者日上,「Dojo」项目被曝光,马斯克称,该项目为标记视觉数据的关键。
特斯拉的车辆在行车过程中会生成大量的行驶视频,「Dojo」计算机的目标就是接收这些数据,并且在无人监督的时候,通过浏览大量视频文件识别此前系统未定义的讯息,例如坑洞、小狗等物体。
标记视觉数据难度很大,目前大多数系统采用的方法是根据图像帧判断,和Dojo计算机根据视频判断相比,高下立见——后者能结合场景,在更复杂的环境中更快地输出判断。
不难看出,Dojo是特斯拉继FSD芯片之后,在自动驾驶领域的又一大杀手锏。这意味着,如果这一效果未来能实现,特斯拉自动驾驶将会更自主。
马斯克在投资者日上表示,Dojo 是特斯拉目前最关注的项目之一,很有可能改变自动驾驶游戏规则。「客观说,这是世界上最好的技术」,并表示 2020 年,将有超过 100 万辆特斯拉汽车在路上使用全自动驾驶硬件,这意味着届时将有 100 万台 Robotaxi 的潜力。
2020 年7月的世界人工智能大会上,马斯克再次提到 Dojo 训练系统,目前遇到的瓶颈问题主要是芯片发热和运算速率,特斯拉也在开发新的总线和散热系统,辅助计算单元更高效地处理相应数据。
如进展顺利,「Dojo」可以改善Autopilot的工作方式——该系统正以「2.5D」运行,而马斯克打算升级,使其可以在「4D」环境下运行。
目前,Tesla Autopilot 已经拥有 300名有才能的工程师,外加500多位技艺高超的数据标记员。
「这是一项艰巨的工作,确实需要技能和培训,尤其是在4D(3D加上时间序列)标签时。」马斯克近期在接受外媒采访时曾透露,公司打算将数据标记员扩大到1000名。
走向全自动驾驶,而且坚持摄像头思路,听起来很简单,但实际上很困难并且需要人才。这也是马斯克推特公开招聘人才的重要原因。
尽管很少人会有信心预测robotaxis何时或者是否到来,但至少就特斯拉而言,它距离拥有未来驾驶辅助技术已经不远,而这足以让传统汽车制造商羡慕不已。