内容为TechCrunch北京2016大会嘉宾口述,由TechCrunch中国整理,未经许可谢绝转载。
嘉宾:微软小娜研发总监杜奕瑾、地平线联合创始人兼软件副总裁杨铭、商汤科技联合创始人兼副总裁徐冰、TechNode郭梅平(主持人)
TechNode郭梅平:我们来一次四个人的座谈,来谈一下人工智能这个话题,有请四位上台。
郭梅平:首先欢迎大家来到我们人工智能的主题论坛。在今年上半年的时候,AI程序AlphaGo战胜了围棋手。其实我们对人工智能都不陌生,像大到可以代替人类工作的机器人,小到我们的手机,我们每天都在接触这些东西。人工智能究竟可以颠覆我们生活什么地步?它发展到什么阶段?我们今天请到三位领域的嘉宾,来跟我们聊一聊AI。
徐冰:我是徐冰,来自商汤科技。我在香港中文大学攻读博士的时候,参与了这样一个过程。我们是全亚洲最早开始大规模深度学习研究的团队,在2012、13年,我们把深度学习应用到视觉领域,在全球范围之内有29篇论文发表,其中有一半是来自于我们这个团队。
在2014年我们创办了商汤科技,到现在我们也是一个有100多名博士和教授,在规模性的在做深度学习研发和应用技术开发的团队,也是整合学术界和工业界的资源,迅速的将各类成熟的AI技术进行商业化变现。
杜奕瑾:大家好我是杜奕瑾,我来自微软AI,我是在微软亚洲工程院负责微软小娜这个产品的研发的产品总监,谢谢大家!
杨铭:大家好,我是地平线机器人杨铭。我们是去年夏天成立的AI领域的公司,我们公司的目标是把软件、算法、硬件、芯片相结合,能够提供一个比较融合的人工智能解决方案,希望各种设备都有人工智能功能,能够让大家的生活更加安全。
我们公司创始人是于凯(音)博士,我们现在在中关村,我个人原来是在Facebook,去年夏天能够有幸参与人工智能的创业大潮。谢谢大家!
郭梅平:我们听到各种声音都再说人工智能非常的热,人工智能是未来。其实真正运用起来的话,其实大家有的时候对它说话的时候,还是多多少少有些困难,就是觉得它的理解有些欠缺。从人工智能,包括机器学习这些方面来说,各位觉得难以突破的困难或者是坎儿在哪呢?
杜奕瑾:你可以看到微软在人工智能的投资是非常的多,像刚才提到比如说像希瑞的理解有时候可能有点卡,它牵扯的层面非常多,包括大数据的分析,包括语意的理解,包括你有没有对的东西。
以微软来讲,我们微软在人工智能大概是哪个层面。我们在9月底的时候,微软在硬件的部分有一个(英语),就是在人工智能硬件我们可以在很快的时间去(英语)AI的计算,就是从CPU、GPU。
再就是我们去支持我们大数据的分析部分,我们当然有我们的团队在后面,我们给第三方有我们的(英语),因为没有(英语)你是没有办法理解,没办法知道这个世界发生什么事情。
我们有这个(英语)才可以知道,像你刚才讲的,当我讲一件事情,希瑞怎么知道,或者微软小娜怎么知道,微软小娜它会知道这个世界你身边有什么东西,你有什么朋友,你在说这句话的时候,他才有办法知道你在说什么。这就牵扯到我们要有很全面的数据收集。
我们微软有很多开放的平台,其实最近大家可以看到清洁在语音辨识,我们语音辨识比人去听还来得清楚,我们有一个CNTK,它在后面支持我们做(英语)这个部分。我们做语音辨识,我们同样来做图像处理,我们其实微软可以在影像识别,可以达到比人的眼睛识别还来得精准。
当我们有这么多的识别之后,我们把它变成一个产品,我们微软有很多的认知服务系统,我们的语音辨识、语音理解、影像识别,就会在我们内部其实是已经在广泛的使用。对外我们去开放的话,我们通过我们微软的(英语),比如说第三方可以有自己的语音辨识,语音理解。
再往上的话,就是微软小娜,它有几个寓言,我们未来最自然的(英语)。对未来来讲,我们要着力发展的就是,不是在发展APP,其实以后人机交互的体验,主要就是会人跟一个(英语)做交互。
我们未来有一个人工助理,你刚刚问为什么说有些体验,当用户在用克他娜(音)的时候会觉得比较顺,就是有这些技术。
杨铭:实际上最近人工智能由于深度学习,深度神经网络发展有很大的技术突破和提高,但是基本上还是统计学习的范畴,是从数据中总结规律,实际对于问题的理解和推理,深刻的分析还是有所欠缺的,这是一个原因,技术还没有完全解决所有的问题。
另外从技术角度来说,它对长时间的记忆,你能够长时间积累知识,长时间的理解知识,这方面还是有欠缺的,这是两个技术上的问题,还需要改进的,或者做得更好的地方。
徐冰:非常认同两位的分享。现在我们看到深度学习其实处于一种爆发阶段,在这个阶段其实我们这些做研究的中间面临一个很大的问题,就是你在遇到一些未经突破和解决的时候,你看不到市场上,或者行业里面已经有的解决方案,这些东西都依赖于团队本身的创新能力和原创能力来解决这些问题。
像我们最早做人脸识别2014年的时候,当时涉及到一个计算能力的问题,我们当时是租用了深圳的超算中心,租了一个月的时间,才跑出来一次结果。这是在2014年,也就是两年之前,我们看到做深度学习和人工智能一个很大的瓶颈。
后来GPU的发展,以及业务来说,我们积累了比较巨量的数据,数据层面其实也一样,这个算法本身在实际的应用场景里面好不好用,很大程度上也是关系到你有没有在实场景里面获取大量的数据,并且在大量的数据上进行学习和训练。
在这个上面,当你在做严肃的深度学习训练的时候,你发现比如说现在商汤科技积累的是一亿个个体的人脸照片,超过8亿张人脸数据,这个规模之下,你会发现没有任何的超算集群,或者底层算法平台可以支撑这个规模的深度学习训练。
当这个问题出现的时候,又要想办法解决,因此当我们真正把这些问题解决,发现深度学习可以在亿级别的数据上进行学习训练的时候,这个算法的性能又会得到一个非常巨大的提升。所以这个环节一定是说一步一步往前走,并且这个过程中其实也是依赖于团队本身的创新能力和原创能力,这就是解决问题的点。
郭梅平:关于应用上,人工智能其实应用在很多的层面上,像无人驾驶,它不仅仅是汽车硬件、软件升级的本身,还要配合很多比如说道路交通的更新。各位觉得在以后应用上面,它可能遇到的一些机遇,或者是困难?大家觉得有哪些呢?
杨铭:现在地平线机器人在做一些辅助驾驶的工作,人工智能在一些具体的方面去落地,它不是简单的技术问题,还有相关的上下游产业整合的问题。还是希望不同的公司做更专业的事情,比如说你举到的自动驾驶,有传感器、计算平台、算法、系统集成,还有关于汽车的问题,各个方面可能都需要比较专业的公司去一起努力,才能把整个行业推动起来。
可能并不是说一个公司,或者一个算法公司,AI公司就可以做的事情。这种落地角度来说,需要大家一起努力把这个产业推动起来。
杜奕瑾:两位讲得非常好,其实人工智能它的投资并不是我们想像中,我去做人工智能就去做人工智能,像微软这么大的公司,微软的投资,其实有很大的部分,我们相信人工智能在未来要能够成功的话,肯定是以更开放的方式。微软我们可以提供,像刚才讲到CPU、GPU,我们要怎么去很容易的让第三方可以接触得到最新的科技,我们刚才也提到上亿级的数量要怎么样处理,我们怎么去做运算。这其实有很多行业类别的上下游关系,或者是说他的专业技能,也不是微软自己的专长。
其实我们的做法就是怎么去跟各个合作伙伴很开放的,把我们的技术提供给大家,看在未来人工智能怎么做这块。
徐冰:其实我们做研究的对一个问题都很敏感,就是数据。比如说我们拿自动驾驶案例来举例,它是一个非常严肃的使用场景,这个算法能够自动驾驶这辆汽车,超过了它的整体安全度,现在来看已经超过了驾龄在5年、10年以上的司机。大家从接受程度来说,从它真正开始规模推用来说,还有几个难点,这里面的难点,一个是数据闭环的打通,算法的整体安全度已经到这个水平,但是你不知道它在什么样场景下会不行。
像特斯拉之前在美国的事故,这个车毫无缘故的撞向一个大卡车,后来分析觉得这个大卡车是一个白色的车体,轮子很高,导致这个车像悬浮在空中一样,这个算法就识别成一个云彩,就直接撞上去了。算法本身有一个整体的准确度,但是在使用到元素场景的时候,1%的误差我们都是不能接受的。
在这样的一个情况之下,你要从司机过来的,从实际的使用场景过来的,它就要撞到树上,我们要纠正过来。这样数据闭环的打通,让我们的算法不断的演进。这样的一些场景之下,经过一段时间,有数据闭环不断的数据回流,我们看到,算法上才能够达到一个相对来说大家可接受的安全程度。
其实我们在做很多实际的应用级的场景的时候,这个场景的数据本身可不可结构化,也是一个很难的点。比如我们做医疗,我们面临一个很大的问题,中国是不是有足够量的结构化的医疗数据?因为这个数据的结构化,就跟我们平时看到的人脸和车辆不一样,人脸和车辆的数据结构化,比如说2、300人把数据标出来就可以,但是医疗必须要老医生来标注这些数据,老医生的资源大家都知道,其实在中国你想特定的病症,可能就全国几个专家是老医生,他标注出来的数据才是可以让机器去学习的。
一旦这个过程完成,这个市场前景就会非常巨大,像知识密集型的行业,其实医生是一个,你培育一个老医生要十几年,司机也一样,你有一个十年驾龄也是十几年。像这种需要大量的时间积累才能培育出一个专家的场景,其实本身深度学习这种AI的应用前景都是非常巨大的。但是一个数据的闭环,一个回流,是需要克服的一个点。
郭梅平:大家都提到人工智能这个领域,不想互联网单打独斗就可以,需要合作。之前准备问题的时候有一个投资人提过,现在AI的这些公司,可能说的都非常高大上,其实可能落地比较困难,缺乏一些有效的盈利模式。各位觉得如果做一个成功的AI的企业,怎么样才能够比较好的运营起来?能够盈利起来?
徐冰:其实这方面主持人说得我也很认同,前段时间我也看朱小虎的(音)文章讲人工智能的泡沫会非常巨大,这个泡沫来源于哪呢?我们做技术的人非常清楚,本身人工智能行业有极高的技术壁垒,需要你做严肃深度学习研究,需要你有非常强的运算资源,同时你要有大量的有闭环的场景数据。这些其实并不是一个小团队,或者一个小作坊就能完成的事情。
这里面往往要看本身深度学习的这些公司里面,是否具备这样的资源,你要有一个非常强的团队,在算法上有很强的解决问题的能力。你要有专门的硬件团队,来搭建深度学习的超算。在技术落地的时候,我们还要考虑到是以什么形式去落地,是以云服务,还是软件的形式,还是芯片的形式。这里面其实遇到的各个环节的技术壁垒是非常巨大的。
所以在这样的点上来看,我们看成为人工智能的演说家非常容易,这些道理大家都会讲,关键是有些真正有实力的人,和有实力的团队把这个东西实现出来。相对来说有具备这样的条件的团队,背后占了非常非常多的资本,像地平线其实有非常多的投资机构,包括商汤科技也是前段时间获得顶惠(音)的投资。
当你的技术优势被投资人所接受,被市场所接受,并且你的技术在市场上落地,进行变现的一个验证,到这样一个环节点的时候,其实大家都明白一个道理,从整体的商业模式上来看,我们可以更开放的来考虑这个问题,我们不需要考虑像SAAS云服务怎么收费,你的芯片IP和未来有多少量。
我们可以整体来看,在每一个换代、趋势来讲,到底是什么在核心创造价值?比如说互联网时代,或者是O2O时代,很多人都具备互联网技术,真正在创造价值的时候,很多时候是商业模式,所以商业模式背后占了大量的资本。所以商业模式占了大量的资本之后,他可以收购他所缺失的技术。
但是现在不一样,人工智能我们看到真正是这些技术在提高生产力,原来一千个人的团队,加上AI技术之后,他可以做五千人的出产量,你可以考虑一千人的团队,一百人可以达到原来的出产量。到这样一个程度的时候,是这些AI的技术在核心的创造价值,这个时候资本就会站在AI技术背后,其实一样的模式,技术就可以收购模式,技术可以收购商业模式。关键看资本站在谁家的背后。
这里面我们更开放的考虑这个问题的话,到底是什么在核心的创造生产力,提高生产力,创造商业价值。
杨铭:关于人工智能的产业落地有几方面的问题,首先人工智能会对大家的生活有很重大的改变,所以大的方向上产业机会是很大的。
第二,本质上还是一个技术的问题,技术的发展需要达到一个比较关键的点。比如语音识别的技术,可能需要几十年的积累,比如你没有达到某一个点之前,你都会觉得它落地是有困难的。其实在背后很多的工作都已经做得很多了,如果一旦突破一个点,比如说现在的客服、服务各种方面就会落地了。
觉得并不是只是看表面上落地的情况,但是技术一旦突破一个点之后,它的机会就是很大的。这是第二点。
第三,人工智能是一个非常新的产业,一个新的方向,它的落地方向,怎么和上下游各种产业集合,怎么大家一起合力,这是需要摸索的,这并不是已经有个现成的模式,所以它毕竟是一个新东西,我是有这么三个方面的看法。
杜奕瑾:我们在讲人工智能怎么落地,我觉得人工智能这个东西本身是一个很大的题目。当你在讲比如说这个东西要怎么落地,或者怎么去获利,我觉得先要想我提供这个东西是提供在人工智能这个环节什么价值。比如说像有些价值就是Dita,他就可以创造出价值。
同样有些是人工智能算法的部分是会需要突破的,他在算法有很大的突破,有几个百分点,这就可以让不可实现的场景,让用户觉得可以相信实现的场景,就会创造出它的价值。
还有用户体验,我们在哪些用户体验,像过去网约车一样,通过人工智能它是一个突破性的改变,像很多人提到,以前要约医生很难,有没有可能我们提供一个用户的体验,通过人工智能可以给一个初步的诊断,然后再决定自己要不要看医生。这其实也是一种类似用户体验。
如果我们有办法去提供这个用户体验是好的,它本身也是有价值的。
当我们在投资人工智能,我们要想一下我为什么来做这件事情,我可以提供给别人什么?如果这个东西不是我自己的专长,我是不是考虑其实这个人工智能里面有很多块,都是已经有很强的活泼在所了,比如像商业模式,或者是地平线,或者是GPU、CPU,还有微软本身提供很多开放的平台,是不是就可以找微软来合作,或者找谁来合作。所以你要思考我提供的核心价值是什么。
郭梅平:我们接下来问最后一个问题,也是大家很关心的,就是很多影视剧,包括最近比较火的美剧中,我们被机器人给统治了这种情况出现。各位觉得以后的趋势,我们被这些机器人给替代了,我们灭亡了,还是它们可以代替我们,成为主要的劳动力?
杨铭:我们一方面担心人工智能落地,一方面担心人工智能统治世界。我个人从技术角度来说,我觉得这个担心是完全没有必要的,或者说我觉得如果是20年可能会接近这个目标,都属于是非常非常乐观的估计了。我觉得影视剧,或者娱乐圈做什么都可以,这是娱乐大众。但是严肃的看,我觉得是完全完全离得很远去担心这一点。
杜奕瑾:我觉得好像微软我们的洪院长之前回答过这个问题,我们现在看虽然人工智能这在几年有非常非常大的突破,但是达到机器人来统治世界,其实还有很长的一段距离。
但是人工智能还是很难替代人脑的创造力。比如说我们人脸识别做得很好,语音辨识做得很好,都是我们人规范这个领域,我们做辨识。如果说人工智能要能够统治人的话,就是人工智能要达到一种程度,就是人工智能本身有创造力,它创造想要攻下来的领域。以目前来讲还是非常非常困难的。
之前有一些讨论,希望在9年内达到这个目的,以目前来讲,我认为这是非常难的问题。以目前我们微软的思路,人工智能怎么去帮助人类,就像我们现在的微软小娜,就是以一个辅助性的,或者是我们洪院长将的AI+HI,就是怎么做成一个超级的智能这个角度来去思考。统治世界我觉得短期内我们还不用太轴心。
徐冰:从去年开始整个学术界和工业界一些比较顶尖的人物组成了一个团队提出来人工智能恐慌论。这个事情从我们的一个观点,我们认为真正到来的时间很远,因为一定程度上你要从深度学习的基本原理来看,它是学习人脑的结构,人脑有三千多亿的神经原,没有任何的计算平台,或者说是模型可以容纳到这么多的参数。
从几个数量级的差距来看,真正到完整的情况,还是有很多的壁垒。现在这个阶段在特定的技能上面,比如说下围棋比如说开车,比如说人脸识别,这样一些特定的技能方面,特定的神经网络可以做得很好。这些特定的技能,就可以让特定的系统帮助人做事情的前提。
现在我们看到,在5到10年主要是这么一个主题,如何更好的让智能辅助人类,辅助人类的工作,提高工作效率和出产。这是这段时间的一个主题。
为什么人工智能恐慌论被提出来?像霍金一些学术界、工业界大老都站在这样一个镇静里面?大家已经不太容易控制深度学习学习的成果了。AlphaGo和人去PK的时候,AlphaGo在第一局赢了李适时(音)之后,AlphaGo本身认为它在所有的下棋的点上,都是处于绝对上风。AlphaGo在下棋的时候,它如何落子,已经不理解它为什么这么选择了,所以这是很大程度上人会觉得学习出来的东西不理解,不太能够可控,这是提出来的一个点。
郭梅平:所以大家认为我们还是不需要担心这个问题。
我们时间到这边结束了,再次感谢三位嘉宾对于人工智能的分享,谢谢!
主持人:谢谢各级位带来的分享。