文/ DeepTech深科技
科技领域的盛会众多,CES 占得其中的半数光辉!而今 2018 年 CES 开展在即,会议主角英特尔尚未露面,去年惊艳亮相的 NVIDIA 就再次先声夺人,提前一天召开主题演讲,这一次,黄仁勋带来的内容依旧重磅!
图丨黄仁勋在演讲(图片来源:DeepTech)
首先,演讲在“I Am AI”的主题中展开,已经化身为 AI 教父的黄仁勋依旧黑色皮衣亮相。他首先提到,借助 AI 的发展,以及深度学习环境的完备,AI 已经能够开始自主开发软件,这是去年最令人兴奋的消息,而从今年开始,自动驾驶,以及游戏引伸出来的 VR 应用,都会成为 2018 年的主轴。
首先的要点非自动驾驶莫属,在汽车应用当中,自动驾驶可以大幅减轻我们日常的通勤负担,让我们更安全,也更快速的到达我们想要的目的地,而在运输业中,若采用了自动驾驶,那们我们就可以在现有的硬件架构下,提供更广的运输覆盖率、更大的货运量以及更安全的运输过程,因为自动驾驶所使用的硬件是极为可靠的,因为意外而产生的损失也可以降到最低。
黄仁勋讲到,NVIDIA 推出的首批 Xavier 自主机器处理器现已开始启动,它致力于借助 AI 从各个方面提升驾驶体验,并为 NVIDIA 在自动驾驶领域的众多合作企业和机构提供未来技术路线图。
图丨Xavier 处理器
同时,NVIDIA、采埃孚和百度三方正共同致力于打造专为中国市场设计的 AI 自动驾驶车载计算平台。此次合作基于全新的 NVIDIA DRIVE Xavier、采埃孚的 ProAI 车载计算机、以及百度的 Apollo Pilot。
图丨NVIDIA、采埃孚和百度三方合作
黄仁勋还宣布,NVIDIA 将与 Aurora 联手打造采用 NVIDIA DRIVE Xavier 处理器的全新 L4 和 L5 级自动驾驶硬件平台。
图丨NVIDIA 将与 Aurora
当然,自动驾驶最让人担心的还是安全问题,即便机器发生事故的机率已经被证明大大低于人类驾驶,但这样还不够好,因此 NVIDIA 也推出驾驶功能安全架构。但是安全问题如果要在真实世界中测试,不仅耗费时间,也要花费极高的成本,因此 NVIDIA 利用自己 GPU 的强大绘图技术,发展出用来训练自动驾驶应对安全问题的虚拟环境 DRIVERSIM,可以实时模拟真实驾驶环境,并且让自动驾驶平台在虚拟世界中运作,开发者可以自由控制虚拟世界中的各种参数,借此观察自动驾驶平台的反应,并加速整个训练的过程。
黄仁勋也把 2017 年曾经展示过的车内应用软件环境,给了个正式名称:Drive IX,包含了自动打开车厢、眼睛追踪、手势操作、语音操作等等功能,在改进驾驶感受的同时,也要强化驾驶的安全。
另外,黄仁勋也发表的 Drive AR 这个新的软件层,执行在同样的硬件环境下,可以把真实世界用更直觉的视觉表达方式让驾驶了解目前驾驶过程中的状况,通过一个虚拟的全息视觉平台,把自动驾驶测试平台所得的所有视觉信息通过虚拟环境的呈现方式,让测试过程可以更直观。
除此以外,优步已将 NVIDIA 技术应用于旗下自动驾驶车队的 AI 计算系统。此次合作中,优步 Advanced Technologies Group 的自动驾驶汽车及货运车队将利用 NVIDIA 技术运行 AI 算法。
图丨优步使用NVIDIA 的 AI技术
图丨NVIDIA 在自动驾驶领域有 300 余家合作伙伴
黄仁勋也同时谈到了游戏话题,游戏已经成为运动项目之一,甚至成为国际级赛事,规模甚至要大于其他所有的运动,而在所有的在线平台上,游戏与相关竞赛也是最主要的内容来源,玩家们把自己的游戏过程分享给朋友,分享给全世界,这与我们过去的时代不同,分享也成为这个游戏世代最重要的核心概念。
图丨黄仁勋在演讲(图片来源:DeepTech)
而在游戏主机方面,借助与 NVIDIA 的合作,任天堂推出了有史以来最成功的游戏主机,也就是任天堂 Switch,销售量不仅破了任天堂自己的纪录,也破了所有游戏机的历史纪录。
图丨黄仁勋对比游戏笔记本,左手为MAX-Q 设计(图片来源:DeepTech)
另外,借助新的 MAX-Q 设计,游戏笔记本的重量也得以大幅减少,超薄的游戏笔记本成为可能。而借助这些新设计,采用 NVIDIA 独立显卡的游戏笔记本在性能方面要比 Mac Pro 快四倍,也比目前最强大的游戏机要快两倍以上。可以说是目前主流市场中最强大的产品。
至于在深度学习方面,在 2017 年推出 Tesla-V100 之后,带给市场极大的震撼,不仅效能有极大的提升,新增加的 Tensor Core 也大大的加速了深度学习的流程,Tesla-V100 在小小的芯片中,蕴含了超过超级计算机的计算能量。另外,NVIDIA 也提供了 TensorRT 开发环境,帮助研究人员更快的开发相关 AI 应用。
图丨黄仁勋手持Tesla-V100
NVIDIA 也提供了 DGX 主机,在高效率的冷却以及强大 GPU 核心的搭配下,可以在有限的机构空间中提供最强大的 AI 计算性能。另外在服务器中,借助 GPU 的优势计算能力,NVIDIA 可以在一个机柜中提供等同于传统架构十倍的计算能力,这代表了使用 NVIDIA 的架构,只要传统架构的十分之一成本。
NVIDIA 花了许多时间在解决深度学习上所会遇到的问题,首先在光迹追踪,通过 AI,可以自动计算出被光线照射到的物件颜色,另外,我们也能用 AI 来计算人脸动作,操作者只要输入参数,就能改变脸孔动画,我们甚至能够用 AI 来撰写乐谱,我们只要指定音乐的风格,AI 就能谱出乐曲。
不得不承认,从游戏绘图大厂摇身一变成为人工智能核心角色,NVIDIA 不仅数年来成为相关话题与技术发展核心,其股价也伴随着 AI 的热度在两年之内大涨超过 5 倍,如今,任何在这个产业里的人,谈到 AI,没有人不会谈到 NVIDIA,没有人不会想到黄仁勋。
AI 领域的布局成效卓著
之所以 NVIDIA 可以顺利切换到人工智能的赛道,主要是得益于其在 GPU 上的积累。而 GPU 之所以成为当代 AI 主要计算方式,就在于它拥有了数以千计的微小核心,核心的规模虽明显小于 CPU,只能做相对简单的计算,亦无法直接启动作业系统。但简单正是其最大的武器,这些庞大的核心群可以在一瞬间同步处理完数千到数万个简单的计算工作执行绪,而其具备直连 GPU 芯片的庞大本地端存储器,且频宽也要远大于 CPU 体系。
图丨 CPU 和 GPU 核心特性决定了个别应用的计算效率
并且,NVIDIA 为其 GPU 搭配的 CUDA 环境更是大大降低了相关 AI 计算程序的开发复杂度,在开发环境亲和力远高于竞争架构,且综合计算性能亦独占鳌头的情况下,GPU 在 AI 领域的应用可说一日千里,目前主要云端 AI 计算架构都是以 GPU 为主。
自动驾驶领域领跑群雄
NVIDIA 除了在 AI 议题持续耕耘外,也领先业界推出了不少自动驾驶方案,包括从最早的 Drive PX、DrivePX2,去年 CES 发表的 Xavier,NVIDIA 目标一直以来都是瞄准真正的自动驾驶技术,而不是仅做为驾驶辅助,或者是纯粹的环境感测功能。换句话说,NVIDIA 直接挑最困难的议题做,每一代方案也都不断在性能,或周边配合能力上有着极大的改进,NVIDIA 与主流车厂更是紧密合作,且在软件部分亦不断优化,目前最接近商用阶段的自动驾驶方案可说非 NVIDIA 莫属。
图丨NVIDIA Drive PX & Xavier
距离 NVIDIA 上一次于 2017 年 10 月 10 日在慕尼黑举办的 GPU 技术大会上发布了名为 Pegasus 的新一代 DrivePX 人工智能车载计算平台,更号称是世界上第一个 L5 级别自动驾驶平台。
NVIDIA DRIVE PX Pegasus 的每秒操作超过 320 万亿次——比其前身 NVIDIA DRIVE PX 2 的性能超出 10 倍以上。它的运算性能足以处理最多 16 个传感器的资料,并且同时进行物体检测、GPS 定位、路径规划,还能控制车辆本身,此外它还能同时更新集中存储的高清地图,即使所有的任务同步处理,这个设备也还能有剩余的运算资源。NVIDIA 表示,这样的运算能力完全可以处理 L5 自动驾驶汽车。
当然,作为开发用平台,Pegasus 极为强大,但其功耗高达 500W,使其难以成为量产化的自动驾驶方案,但 NVIDIA 似乎也不紧张,毕竟这个平台的推出已经让 NVIDIA 抢先业界不知道多少步了,毕竟同时期的竞争产品,多半还只能达到 L3 级别。
图丨NVIDIA Pegasus
未来 NVIDIA 凭借工艺、架构的改进,及与性能更好,价格更低的环境感测组件搭配之下,要推出功耗能够符合未来汽车电力预算设计需求的方案,并不会是什么大问题。
IHS Markit 资深首席汽车分析师 Luca DeAmbroggi 认为:“如今,数十家公司正竞相开发自动驾驶汽车,但真正自动驾驶汽车的巨大计算需求对他们造成了限制。全新 NVIDIA DRIVE PX Pegasus 为汽车制造商、初创公司和汽车生态系统提供了实现这一惊人愿景所需的生产方法。”
GPU 架构面对挑战虽越趋严苛,NVIDIA 仍有压箱宝可应对
GPU 计算架构虽强大,也不是没有缺点,尤其是功耗问题,1 块 GPU 计算卡动辄数百瓦的功耗,如果规模一增大,那么对整个计算中心的功耗控制就会显得特别麻烦。
而在自动驾驶领域,包含 Mobileye、Renesas、NXP 等对手几乎都是采用 ASIC 方式针对图像或物件识别采用专属的加速架构,Mobileye 在 ADAS 市场占了将近 7 成市占,是最早投入自动驾驶的方案商之一,其最新的自动驾驶方案 EyeQ4 可以在 3W 的功耗限制下提供 2.5TOPS 的性能表现,且是基于 28nm 工艺。
相较之下,NVIDIA 最新的 Xavier 虽在 16nm 工艺下提供达 20TFOPS 的性能表现,但功耗达 80W。而 Mobileye 下一代 7nm 自动驾驶方案性能将提升到 17TOPS,但功耗仅略增加至 5W。
当然,NVIDIA 也并非完全束手无策,虽然其主打架构是 GPU,但 NVIDIA 实际上拥有设计 CPU 以及其他 ASIC 矢量计算架构、甚至神经网络芯片的能力,万一 GPU 真的在 AI 或自动驾驶领域上再也行不通,NVIDIA 还是有其他架构选择可用。
游戏领域仍将独占鳌头
除了 AI 与自动驾驶外,游戏市场可以说是 NVIDIA 另外一头金牛,虽然毛利明显低于其他产品,但由于在市场上缺乏对手,目前的 PC 游戏市场可以说是 NVIDIA 在唱独角戏,传统对手 AMD 虽力图振作,但是在架构不如人,且晶圆代工厂 Global Foundries 产能配合不上的情况下,光是要满足 CPU 的市场需求就已经明显力不从心,GPU 市场已经无暇兼顾。
独立显卡市场虽不断萎缩,但 NVIDIA 独立显卡的平均单价却得益于对手的积弱不振而不断提高,尤其在超高端游戏 GPU,比如说 Titan 系列产品,几乎都是处于供不应求的状态,不仅弥补了整体市场萎缩所造成的相关产品营收空缺,甚至还能带动整体营收成长。而在新款游戏绘图方案量产之后,不论在产能,或者是性能表现方面,DT 君认为都能优于 AMD 的 7nm 产品,今年 AMD 想要在 GPU 市场重演 CPU 咸鱼翻身的戏码,难度恐怕相当高。