文/Gavin.Z
大多数致力于自动驾驶汽车的人都专注于避免汽车发生撞击之类的事情。这的确也是自动驾驶汽车擅长的地方——尤其是在高速公路和那些不用担心突然有人出现的区域,这样问题的处理简单的多。
Drive.ai 是少有的几个推动自动驾驶技术商品化的新创公司之一。早在四月份就提出隐身模式,IEEE Spectrum也写过它的对于问题一站式深层学习方式。现在Drive.ai正在向那些商业巨头们兜售新式设备,这种设备能使现在的汽车实现自动驾驶。令人感到独特的是,这种设备包括人机互动部件(HRI),能够让汽车直接去人交流。
要理解为什么赋予自动驾驶汽车人际交流的能力这么重要?我们来考虑这么一个问题。当你在没有红绿灯的人行横道上走时,会发生什么?一辆朝你驶来的汽车可能会降速。但是,在你汽车前面走过时,你会与司机进行眼神交流以确定他们看到你了,并且会因此停车。现在,想象在这种情况下的无人驾驶汽车。没有人来控制,你怎么知道这辆车是否:a) 检测到了你;b)明白你要做什么;c)决定为你停车?
像这种情况的交流,发生的频率可能要比你想象的多,可能会涉及到行人,骑自行车的人或者其他司机。自动驾驶汽车不仅使用转向灯,而且他它们需要进行更复杂的沟通。甚至包括有用的信息“前方有事故,请慢行”,或者是挡到路时会道歉。
第一代自动驾驶汽车上装备人际交流部件最大的必要性是源于这样一个事实:从传统汽车到自动驾驶汽车有一个很长的过渡时期。一旦公路上跑的都是自动驾驶汽车了,车与车之间通过无线交流,那么人机交流也就不是什么大问题了。
有时候,感觉自动驾驶汽车公司都高度关注最终目标。因为过渡时期会非常混乱,那么通用的解决方案就是忽略(“我们稍后解决这个问题”)或者避免这个问题。再次回到人行道这个例子,和帮助人们能够安全通过人行道不一样,这是为了能够确保自动驾驶汽车不会在人行横道上撞到人。
图片来自 Drive.ai
IEEE Spectrum近期就应用无人驾驶汽车人车交流技术和Drive.ai 针对自动驾驶一站式深层学习方式的细节采访了Drive.ai的联合创始人、董事长Carol Reiley博士。雷锋网(搜索“雷锋网”公众号关注)摘编如下:
IEEE:Drive.ai 的自动驾驶汽车方法有什么独特之处?
Carol Reiley:我把自动驾驶汽车看作是大多数人都将与其交流的第一代社交机器人。这种机器人不像人,但是是可以通过人工智能激活的智能机器。
[我们必须问问自己],一旦你解决了从A点到B点的问题,那么你如何让无人驾驶汽车与在这条路上的其他人交流呢?这种关系看起来会是什么样?在人行道,十字路口或者当你加入交流当中时,非语言性的交流会是什么?当你取代了司机时,这自动驾驶汽车如何表达?它怎么样交流才会使每个人都感觉安全并且相信它?我们认为只是人类现在还没有关注的一种交流。
IEEE: 说到通过人工智能激活智能机器人,它如何在自动驾驶领域获得发展的?与参加2007年无人驾驶汽车大赛的汽车相比,AI的无人驾驶汽车现在有什么不同?
Carol Reiley:对于这个问题的回答有很多方面。我们正在由浅到深层学习来建立我们公司;Darpa是指深层学习之前。Sebastian在谷歌开发无人驾驶汽车之前,带领无人驾驶汽车大赛团队。他曾说:“计算机视觉没有作用,我打赌高清地图和激光雷达绝对有效。”谷歌无人驾驶汽车项目就是这么设立的:假设计算机视觉不起作用。
在2012年,谷歌彻底改革了计算机视觉和感知的人工智能。现在这一产业也是由深层学习提供动力。在这一点上来说,谷歌在几年前就已经投资于非深层次学习方法,而且可以切换不同模式,但是很难根本改变这种方法。这就是我们新创公司的优势之一:我们正在建立从浅层到深层学习的无人驾驶汽车公司。而且我们不只是局限于感知,同时还能作出决定。这不仅是一段到另一端这么简单的方法,而是说明AI从2007年无人驾驶汽车大赛后发生了哪些变化。
IEEE:人们的无人驾驶汽车用的是哪种传感器?相比于激光雷达来说,你认为你们的摄像机怎么样?
Carol Reiley:在我们用深层学习传递途径之前面临这些问题:汽车上该放那种传感器,我搜集到多少数据,及我需要驾驶多少英里等等。就深层学习而言,我们采用这一方法是因为我们想进一步推动低成本的传感器。廉价传感器就是摄像机,加上深层学习,足够分析图像。我们也有其他传感器以备不时之需,但是我们真的要比其他大多数团队更加推崇摄像机,而深层学习法能有助于此。
有些团队在中心位置使用激光雷达,或者想没有高清地图不能解决这个问题。人类在本地驾驶汽车,脑子里没有地图也能驾驶得不错。并且他们基本上也都有立体照相机之类的东西。我们的团队唤醒各种低成本的传感器;如果Quanergy可以得到100美元的激光雷达,那就太好了,我们会用它。我们不是在炫耀我们用照相机可以做到什么,我们只是在努力建造人们可以真正使用的安全廉价系统。
IEEE:人车交流对于无人驾驶汽车为什么这么重要?
Carol Reiley: 当人类驾驶的时候,他会寻找所有的社交线索。比如说,你看着面前的一辆车,如果它的车轮是向右拐,那么你可以推断它接下来的动向:汽车可能向右转。人们还会努力寻找其他细微线索来帮助他们驾驶。这些线索会使我们的汽车看起来有社交智能,因为你可以在汽车运动前预判出来。
我们实际上就是推动无人驾驶的社交功能。当人们之间不用语言交流时,有时会让人感到迷惑。当你把人移开,那么这些汽车就需要智能驾驶,并且能够被公路上的其他人理解,而且要确保安全。因此,在十字路口,汽车和行人之间会发生什么?我们正在看我们的汽车如何表达自己,我们通过LED灯、R2-D2 声音及转向时给出的指示来看。我们正在考虑,怎么样让我们的汽车与其他所有人交流。
关于驾驶,非常有趣的事是驾驶是动态的,周围有很多人,而这些人去哪里也不一定。对于一辆需要做出即时决定的自动驾驶汽车来说,当它切换模式时,它需要非常易懂,我们怎样向外界表明这辆车是自动驾驶的,怎样表明我们的意图是什么。
IEEE:这么强调人车交流是不是意味着自动驾驶汽车的驾驶部分的问题大部分已经解决了?
Carol Reiley: 我认为,这个产业大部分精力都是放在这里驾驶技术上。这并不是说人车交流是和它完全分开的;我认为它们是紧密相联的,而且两者需要共同进步。这不是在实验室的机器人。我们需要考虑很多和人有关的问题。我认为,汽车产业采用了模块化的方法,但是无人驾驶却不是模块化的问题:他们是基于软件的整体化问题,必须要后退去看整体情况。
IEEE:Drive.ai的计划是什么呢?
Carol Reiley: 我们不是在生产汽车;我们是为企业提供新的设备。因此,我们会选择对运货或拉客感兴趣的合作伙伴。现在汽车来到Drive.ai工厂,我们给它加上车顶行李架,行李架上有传感器和人车交流部件及软件,而且我们会与合作伙伴共同是汽车能在依据真实路况行驶。
在逻辑上,我们将此视为自动驾驶汽车安全驾驶的第一步。我认为,全球自动驾驶汽车的发展会带来巨大的混乱。我认为I,人们现在根本没有考虑到和汽车相关的人。即使我们解决了自动驾驶汽车的问题,那么更大的问题会是人类。人类会搞砸一切,你必须要真的为了人类使用而设计自动驾驶汽车。而他们又如何理解这一点。我们想快速安全的推广这一技术。我们将路况策略视为我们和合作伙伴的第一步。而且我们也非常有兴趣开发一个第四级别(全自动)的方式,因为第三级别(有时人们可以驾驶)会带来混乱。
Drive.ai有自己的车队,我们将会在加州进行测试。因为公司的愿景是包括能够包括“能够和我们沟通,有个性,让我们感觉受欢迎并且安全,甚至是完全不需要人的汽车。”我们建议你想出一些创造性的方法来给他们制造麻烦,看这些汽车会有什么反应,然后告诉我们。
最后,Drive.ai将从运送货物发展到人货共乘及公共交通和私家车都能满足的程度。该新闻稿提到了一些和原始设备制造商及汽车供应者的合作关系。因为有1200万美元的资金,所以在一年或两年后,当看到自动驾驶汽车在加利福尼亚友好行驶并运送货物时,我们不会感到吃惊。
内容由 雷锋网 提供授权发布,未经许可谢绝转载。