公众号/大数据文摘
大数据文摘出品
来源:wsj
编译:牛婉杨、夏雅薇
昨天,英伟达在线上召开了2020年GPU技术大会(GTC),发布了多款新硬件:包括全新的数据数据处理单元(DPU)、低价版边缘AI开发板Jetson Nano 2GB以及专业级显卡RTX A6000。
同时,在本次大会上,黄仁勋还透露了上个月收购Arm,以及与Arm生态整合的细节,还表示要在英国建立一个超算中心。
那么,英伟达收购ARM到底有什么深层原因呢?
在现代计算机最初那个时代,有一个趋势占据了主导地位:摩尔定律。
这个定律最早来自英特尔公司联合创始人摩尔(Gordon Moore)的预测。摩尔定律认为,芯片上的晶体管数量大约每两年就会增加一倍,这并不是什么物理定律。换言之,意味着这些芯片以及它们所驱动的计算机的性能在大致相同的时间内性能也提升一倍。这就形成了这个行业的核心理念,孕育了价值数万亿美元的技术,颠覆了我们日常生活的方方面面。
随着芯片制造商已经达到原子级电路和电子物理的极限,摩尔定律已经放缓,有些人说它的时代已经结束了。但是一个不同的法则已经出现,它将对未来的计算机领域产生巨大影响。
作者把它称为“黄氏定律”,以英伟达首席执行长兼联合创始人黄仁勋的名字命名,这则定律描述了为人工智能提供动力的硅芯片如何每两年性能翻一番以上。虽然这一增长可以归因于硬件和软件,但它的稳步发展使其成为一种独特的工具,从自动驾驶汽车、卡车和船舶,到我们个人设备中的人脸、声音和物体识别。
英伟达首席科学家、负责研究的高级副总裁比尔·达利(Bill Dally)说,从2012年11月到今年5月,在重要的人工智能计算领域,英伟达芯片的性能增长了317倍。换句话说,这些芯片的性能平均每年翻一番以上,这一进步速度使摩尔定律相形见绌。
长期以来,英伟达的专长一直是图形处理单元(GPU),当有许多独立任务需要同时完成时,GPU可以高效地运行。另一方面,中央处理器(CPU),就像英特尔专门从事的那种,效率要低得多,但在快速执行单个串行任务方面会更好。你不能把每一个计算过程都分解,这样GPU就能有效地处理它,但对于那些你能做到的——包括许多AI应用——你可以在消耗相同能量的情况下,以多倍的速度执行。
英特尔是摩尔定律的主要推动者,但绝不是唯一的推动者。要让它长久存在,需要数以万计的工程师和全球数百家公司的数十亿美元投资。同样的,英伟达并不是唯一一个遵循“黄氏定律”的公司——事实上,在某些应用中,英伟达自己的人工智能处理技术可能正在失去吸引力。这可能是它在本月以400亿美元收购芯片架构公司Arm控股(Arm Holdings)的主要原因。Arm是另一家在持续提升人工智能速度方面发挥关键作用的公司。
人工智能专用硬件的进步将使一系列乌托邦式和反乌托邦式的应用成为可能,从汽车事故的终结到无处不在的监控。但现在,它也使一个不那么奇幻的应用成为可能,它将对我们的购物方式和数百万零售业工作的命运产生巨大影响:无人收银。
Standard的结账技术通过摄像头和位于商店后部的英伟达驱动的系统来跟踪顾客和他们购买的产品,该系统每秒执行数万亿次运算。
总部位于旧金山的科技公司Standard最近宣布了一项与Circle K(一家连锁式便利商店集团)的协议,将把它的一些商店改造成亚马逊 Amazon go 商店的模式,让人们可以在那里享受“拿起就走”的购物体验。这家成立仅三年的初创公司在整个商店安装摄像头,然后将视频传输到后端由英伟达驱动的系统,该系统每秒执行数万亿次运算。当顾客从商店的货架上抓取物品时,系统会对所有物品进行统计,并在他们走出商店时通过他们的移动设备扣费。
至于其发展前景,一个每秒执行这么多操作的系统,至少在人工智能推理任务方面,比2012年世界上最强大的超级计算机还要快。
“老实说,我们什么也做不了,只能等着英伟达每年都降价,”Standard创始人兼首席执行官乔丹·费舍尔(Jordan Fisher)说。
TuSimple的自动驾驶卡车在驾驶室中加入了一些最新的AI算力。
“黄氏定律”影响的另一个类别是自动驾驶汽车。总部位于圣地亚哥、业务迅速扩张的自动驾驶卡车初创公司TuSimple,面临的挑战是制造出一种能够满足柴油驱动半拖车的动力和空间限制的自动驾驶系统。对于一辆典型的TuSimple车辆来说,这意味着将整个消耗不超过5千瓦的系统塞进卧铺驾驶室的风冷柜中。
考虑到这样的功率限制,最重要的是每瓦特的性能。TuSimple联合创始人兼首席技术长Xiaodi Hou说,该公司的英伟达驱动系统,其性能每年都要翻一番。
自本世纪中期以来,人工智能的一个非常不同的领域也出现了类似的性能提升:我们的手机。
2017年,苹果推出了iPhone 8,内置了神经网络引擎。苹果专门为运行机器学习任务设计了这种芯片,这对许多种类的人工智能都很重要。(其芯片制造合作伙伴是台湾积体电路制造股份有限公司。)
Nexar公司的联合创始人兼首席技术官Bruno Fernandez Ruiz表示,苹果决定让手机上的任何应用程序都能使用该芯片,同时在Android手机上引入了可与之媲美的芯片和软件,这使得新型人工智能业务得以开展。通过在用户手机上处理仪表盘摄像头捕捉到的视频流,Nexar的技术可以提醒驾驶员注意即将发生的危险。
移动人工智能的应用正在成倍增加,应用于从洗碗机到门锁到灯泡的手机和智能设备,以及进入城市、工厂和工业设施的数以百万计的传感器。芯片设计公司Arm是这场革命的中心。在众多大大小小的科技公司中,苹果公司就拥有Arm的iPhone芯片专利。
在过去的三到五年里,机器学习网络在效率上以数量级的速度增长,Arm公司机器学习部门的营销副总裁Dennis Laudick说。他补充道:“现在更多的是让产品在一个越来越小的环境中工作。”Arm最小、最耗能的芯片,小到可以由手表电池供电,现在可以让摄像头实时识别物体。
Nexar联合创始人兼首席执行官Eran Shir表示,人工智能处理从云端转移到“边缘”,也就是设备本身,这解释了英伟达收购Arm的愿望。英伟达几乎垄断了云计算中的人工智能处理。但两年前,Nexar 40%的数据处理是在云上完成的,而基于Arm的芯片使其能够在移动设备上完成更多的数据处理,而且速度更快,因为它不需要先通过互联网进行传输。如今,云计算只完成了15%的工作。此外,一些功能,比如基于视觉的停车助手,直到最近才成为可能,手机中的芯片变得更加强大。
专家们一致认为,作者称之为“黄氏定律”的现象正在以惊人的速度发展,但谁也说不准接下来会怎样。非营利机构Open AI表示,基于经典的人工智能图像识别测试,性能大约每年半翻一番。但就连对“绩效”的定义达成一致都是一项挑战。来自谷歌、百度、哈佛、斯坦福和几乎所有其他主要科技公司的研究人员正在合作,想更好、更客观地衡量它。
对“黄氏定律”的另一个警示是,它所描述的处理能力不能应用于所有应用程序。TuSimple的侯先生说,即使是在像自动驾驶这样通常以人工智能为中心的任务中,系统运行的大部分代码也需要CPU。英伟达的Dally博士承认这一问题,并表示,当工程师给局部猛加速的时候,剩下无法加速的部分自然会成为瓶颈。
也有可能,就像之前的摩尔定律一样,“黄氏定律”也将失去魔力。Arm机器学习部门负责产品营销的副总裁Steve Roddy说,这可能在10年内发生。但这一法则已经可以在相对较短的时间内实现很多功能了,从无人驾驶汽车到感知并对环境做出反应的工厂和住宅。
相关报道:
https://www.wsj.com/articles/huangs-law-is-the-new-moores-law-and-explains-why-nvidia-wants-arm-11600488001