编译 | 人工智能头条(公众号ID:AI_Thinker)
参与 | reason_W
上月,由 Michael I.Jordan 、Jeff Dean、李飞飞、LeCun 等多位人工智能领域的大牛发起的系统机器学习会议 SysML 在斯坦福开幕。
会上,机器学习宗师级大牛 Michael I.Jordan 就《系统与机器学习的前景与挑战》进行了主旨演讲。因为和 NBA 球星迈克尔·乔丹名字相近,他有着一个有趣的称号:“The Michael Jordan of Machine Learning”,即机器学习界的迈克尔·乔丹。
为什么说他是机器学习宗师级大牛?要知道,在这一领域的重要学者如吴恩达,Zoubin Ghahramani, Tommi Jaakkola, Lawrence Saul 和 David Blei 都是他的学生。他现在担任加州大学伯克利分校电机工程与计算机系和统计学系教授。
Michael I.Jordan的重要贡献则包括指出了机器学习与统计学之间的联系,并推动机器学习界广泛认识到贝叶斯网络的重要性。他还以近似推断变分方法的形式化、最大期望算法在机器学习的普及方面的工作而知名。
此次演讲中,从一开始他就现在所谓的“AI”进行了抨击。他认为,现在媒体上热炒的“AI”概念言过其实,很多人都是为了借此向 VC、媒体以及大众兜售概念。至于真正的 AI,“我们根本还没有实现”。也有相当一部分研究者陷入了深度学习的泥潭,思维变得更加狭窄。
他回顾了机器学习领域的现状,以及今后发展面临的挑战。虽然机器学习理论目前的发展达到了一定高度,但他很讨厌人们现在突然将它称为 AI,因为那仍然还只是机器学习。他认为真正 AI 的实现,需要依靠逻辑、推理、决策等运算的突破才能实现,但现在它们之间还存在明显脱节。
一些经典 AI 领域,如计算机视觉、NLP 等还远未达到智能和实用的地步,有赖进一步研究和努力。与此同时,传统的社交平台,如 Facebook,还远没有真正地将人们连接起来。医疗、金融、音乐、餐饮等众多系统平台仍存在巨大的想象空间,要做到这些,需要研究者们跳出传统视角。
本文为 Michael I.Jordan 在大会上的演讲实录(有删节),人工智能头条整理。
▌ 我们还没有实现真正的 AI
你们知道,我之前从 MIT(麻省理工)离职去了 UC 伯克利。这其实是因为 MIT 没有任何跟统计相关的专业,并且直到现在也还不算有,而我认为统计学对计算机科学至关重要。虽然今天计算机科学的发展已经十分激动人心,但它依然还没有解决推理性的问题,在计算机和推理之间有一个脱节,所以我才要跳槽去研究概率和统计。
很多人说我这些做法是在从统计视角在研究 AI,这种看法欠妥,我只是在研究机器学习。AI 是一个非常宽泛的概念,它几乎涉及到所有层面的计算机科学。它的每一部分都应该涉及到数据流,并且应该基于这些数据自适应地进化。这里面全是计算机科学,但直到今天,这一看法也还没有在计算机系得到很多认同,他们仍然认为统计是 AI 的一部分。
我已经疲于应对这些争论了。
今天,我们到处都可以看到“AI”这一字眼,媒体上铺天盖地。这让我感到非常不安,因为那些说法太言过其实了。我们没有实现人工智能,没有实现智能,甚至连它们是什么都不知道。我们说现在的系统都涉及到数据的输入输出,它们其实是在模仿一些很聪明的东西,但也仅仅是模仿,根本称不上是智能,我们并没有实现它。
今天,很多人乐衷于使用“AI”这个流行词。但这只不过是他们借此向 VC(风险投资)、企业、媒体以及大众兜售一些他们自己的概念。至于真正的 AI,我们根本还没有实现。我现在虽然不再跳出来争论这些话的对错,但依然会在内心时时刻刻提醒自己:我们还并没有实现所谓的 AI。
现在,我非常高兴我们有了一个这样的社区,我们当前真正需要的正是建设性的努力,那必须保持严肃和清醒。并不是所有的炒作都是在为了在 AI 淘金热中大赚一笔,他们或许也是为了能够真正实现 AI,让这个世界变得越来越美好,让 AI 更加稳定,更加真实,足够支撑建立一个全新科学领域所需的概念。
这就像有人喜欢土木工程、喜欢化工工程师一样,我也非常尊敬他们在所在领域做出的实实在在的努力。他们研究出的东西切实改变了每个人的生活,而这也正是 AI 领域所需要的和依然欠缺的。
▌机器学习领域的现状
机器学习理论已经发展到了目前我们所看到的高度,我在二十年前我就已经预见到它的发展会是这样:数据将无处不在,用机器学习进行决策和商业建模将成为我们的习惯。但我很讨厌人们现在突然将它称为 AI,虽然最近有一些新的想法出现,但那仍然还只是机器学习。我不和他们争论,并不代表认可他们的说法。相反,我会更加坚持自己的追求。
这世上并没有魔法,机器学习只是将它的输入输出映射到它对一些处理机制的模仿之上了,虽然这看起来很神奇,但其实依然还有很多真正的问题——比如从广义上来说,很多层面上的系统问题——都还没有得到解决。
机器学习也还远远没有发展到足以成为一个可靠的工程原则,可以针对现代数据分析问题得到鲁棒的、可扩展的解决方案。有很多涉及到不确定性、推理、决策、鲁棒性和规模化的问题都还没有得到解决。更不要说经济学系统了,因为我们甚至对建立系统时的定价和激励行为也还没有足够的思考。社会法律系统也是如此。
我以为每个人都会或多或少意识到这一点,但没想到等待他们意识到这一点需要的时间却长得不可思议。
扎克伯格在一年前的演讲中曾谈到他创建 Facebook 时的经历,“我什么都不知道,在这一过程中也并没有扮演任何角色。我们只是搭建了一个平台,而关于如何使用它甚至都没有规定。但后来让我感到震惊的是,人们并没有很好地使用它”。
我们不仅要时刻注意人们有没有用这个平台来做坏事——比如虚假新闻,还要让人们可以通过这个平台得到正确结果,否则每天都会有数十万人因此做出错误的医疗决定、糟糕的交通状况或者财务决策。到目前为止,我们甚至都还没有在解决这些问题上取得一点进步。我们的反应就好像在说我们本来就是如此。
对我来说,系统机器学习瞄准的目标太低了。这个社区中的很多人炒作深度学习太过头了,我们已经有了反向传播(Backpropagation)这个伟大的学习机器;我们要让它可以更好、更快、更容易实现,所有这些都会很快实现;公司也会成立,经济也会向前发展。但这样做的目标定得太低了,这仅仅是一个非参数回归问题,甚至都谈不上“是”。所以我希望作为一个社区,我们可以有更高的目标,我们不能仅仅努力让反向传播更容易。
▌ “AI” = IA + II
下面我来谈一下为什么我说在人们的脑海里计算机和推理没有连接起来。
其实在我一开始接触这个领域的时候,我当时学习了一些关于 AI 的东西,但我没有真正研究过。那时候有很多研究 AI 的观点,比如通过广度优先搜索来寻找一个明星,这也是约翰·麦卡锡(John McCarthy)真正在 MIT 在做的研究。(注:约翰麦卡锡,人工智能领域的开山鼻祖之一,他曾发起和参与 AI 历史上著名的达特茅斯会议,后来前往斯坦福并组建了斯坦福人工智能实验室。)
我要说的这个故事和你们往常听的有点不同:人工智能这个概念并不是 Minsky、McCarthy、Newell 他们那些人坐在一起开了个会就讨论出来的。
麦卡锡刚到 MIT 的时候就说过他会研究智能(Intelligence)和计算领域。他们说那并不是控制论,控制论已经有维纳在做了,麦卡锡解释了这两个领域的区别。真正让人们意识到 AI 是一个新领域的是,这个领域更多的是基于逻辑而不是控制理论和信号优化,所以他必须给它一个新的名字,所以他发明了“Artificial Intelligence”这个词。我觉得这个故事更加真实。
然而,历史的奇异转折之处在于现在研究 AI 的所有想法都在维纳那一边,都是关于优化统计的,并且没有逻辑,但现在大家用的“AI”这个词却依然还是麦卡锡发明的那个词。
无论如何,AI 依然是一个伟大的愿景。这是一个在思考应该如何将计算实体与软硬件结合到一起,并构建能够捕捉智能的东西的哲学问题,这很有意思。
我认为这仍然还只是一个学术领域的愿景,并不认为它有必要或者已经足够用于促进社会进步或工业发展。我并不相信我们能够建立通用智能,并且它可以解决世界上所有问题的说法。那只是愚蠢的科幻小说里的东西,并且是既不必要也不足够的。我们需要把思想从一些真实问题中解放出来。有很多有钱的名人说我们要建立一个通用人工智能,然后就可以解决世界上的问题,比如癌症。我并不想谈论这些东西,但人们总是这样在说。
不管如何,现在有个有趣的观点,我们并不是要让所有的事情都变好。与此同时,真正发生的事实也并不是 AI 取得了巨大的成功,而是“IA”(Intelligence Augmentation)取得的巨大成就。
搜索引擎就是这其中的一个代表,它是一个机器学习系统,不停地获取数据并随时间进行改善以做出更好的决策。 像其他很多实际工程系统一样,那是一个涉及到很多东西的机器学习算法,但那也意味着很多智能。比如我不必记住白俄罗斯的首都,但是当我在网上搜索一下就可以马上知道。我看起来非常聪明,因为我无所不知。
我也可以在这里说英语,然后通过安装同传系统让你们听到汉语。看起来似乎我可以说很多门语言,但其实我并不会说汉语,这是因为电脑增强了我的智能。很多这种用深度学习实现的东西,我认为它们很有趣,但是——比如你见得很多的风格转换,人们输进去一张图片,然后它会被转换成另一张很酷的图片,看起来像梵高的画一样,那作为一个玩具会非常有趣。但它真正做的是增强了人们的创造力。
它是一种“增强” ,并不是人们说的智能。但那已经很有趣了,你甚至可以用它来创作音乐,但直接用它写交响乐就很傻了,谁会在乎一台电脑会不会写交响乐呢,无论那意味着什么。但它却可以为下一个贝多芬或者杰出艺术家的诞生提供一个自由创作的环境,那才是真正令人激动的,那就是 IA。
还有一些更为重要的东西,我将其称之为“II”,即“Intelligent Infrastructure”。在我们身边发生的事正越来越多的体现着这个世界对我们的了解。
世界正在被连接起来,比如我只要动动手机,就可以在几秒钟之内约到一辆汽车,它可以带我到达目的地。这个世界正在通过网络变得越来越智能——只要你在一个大的复杂系统上加上数据,加上人类,那就是物联网。那是一个万亿美元的经济市场,并且正在改变人类的生活,改变你对于医疗、金融和日常生活的想象。所有这些都是非常巨大的改变,并且在过去的几十年确确实实发生了。
这让我想起了亚马逊——他们是第一家认真做这件事的公司,并且是在 90 年代,远在我们炒作这个概念之前。现在有很多公司正在建设物流预测以及欺诈系统,还有推荐系统,这些都是非常棒的事情,但那都是机器学习,不是我所谓的 AI,真正的 AI 将比我们现在看到的更为激动人心。
我认为在这里有一个脱节。如果你以这种经典的方式研究 AI ,你或许会对视觉、语音、自然语言处理还有机器人感兴趣,因为你是对这种具体的智能体感兴趣,它们会像我们一样做出智能的行动。你想到的所有东西都是和具体智能体有关,所以你可以根据场景开发算法,并且将它们转变成目标、标签或者语音。那都是很棒的,但那并不能解决我们在建立一个真实世界系统时所遇到的真实问题的十分之一。那只是“IA”或者“II”,而且人们的注意力会被视觉或语音方面的问题所分散。
▌ 未曾解决的经典 AI 问题
虽然有些经典的 AI 问题看起来已经快要解决了,但我要说,我认为我们实际上还远没有解决这些经典的 AI 问题。
在计算机视觉中,我们可以比之前更好的标注目标和场景,但它们并不是真实场景,那只不过是从互联网上获取的包含目标的图片。如果你使用相同的训练集进行测试,正确率可以达到 90%,但是在真实的世界中那可能只有 20%。因此,我们只不过是对场景中的对象进行了标注,并没有真正解决这个问题。而关于场景的意义是什么?场景中正在发生什么事?接下来会发生什么?我们甚至都还不知道。所以人们说计算机视觉技术得到的一些东西非常荒谬。
语音领域和语义领域也是一样。总的来说,我们生活在一个依靠听觉的声音世界中,但在闭上眼睛之后,我们还远不能单纯靠听声音来了解周围世界。因为没有语义信息,甚至都没法开始自然语言处理。
翻译并不是输进去一种语言的字符串,然后得到另一种你之前已经见过很多次的语言的字符串就可以了。我说法语很流畅,你用英语和我交流,我也能理解你说话的意思,我会将你话里的概念转换成法语词汇,而不是将英语字符串映射为正确的法语字符串。你甚至还可以再通过努力让它的正确率达到 90%,但那依然是无效的。
视觉技术可以通过有监督标记和一些无监督标记技术来应用,而自然语言就不行。如果不相信,你可以试着读一下道格拉斯·霍夫施塔特(Douglas Hofstadter)前几天在美国《大西洋月刊》上的一篇文章。他通过英语、法语、德语和中文四种语言翻译的比对论证得出一个结果:谷歌翻译即使应用了人工智能技术也没有真正理解语言。
语言真的是人类的智慧,包含了对这个世界各种事物的讽刺、隐喻、引用和参考。只有我们真的了解这个世界才能搞明白语义,它需要理解人类的社会行为、概念行为,而这些并不能通过标签数据和很多字符串来实现。
让我们继续回到主题上。刚刚我们讨论的是翻译,现在说一下对话。
对话并不只是一个可以和你不停对话的聊天机器人,虽然那听起来比较有趣。它实际上是试图实现一个目标,比如我想订一个飞往巴黎的航班,这中间涉及到我自己的各种复杂偏好,然后最终可以把我带到那里。所以我们必须有一个对话逐渐地将我这个意愿通过机器人落实到真实世界的实际行动上,但我们离这一步还很远。
谈到机器人技术,你知道它有很多进步。但我仍然十分怀疑,目前工业界的机器人只能在非常有限的环境中工作。我们虽然已经可以让机器人和人类进行互动,但我并不认为它在我们的生活环境中工作会没有问题。
▌ 机器学习近期的挑战
现在让我们接着谈论技术。如果你是一个系统机器学习研究人员,并且认为自己的生活将支持深度学习方式——我也认为这非常有用——但这里还有一大堆其它的甚至称不上是 AI 的东西。
多重决策(Multiple Decisions),统计学家一直在讨论这个话题,但机器学习领域的人却几乎不谈论这个。你可以构造一个神经网络,它需要输入一些图片或者搜索引擎营销信息(SEM),甚至一些数据的历史信息来进行决策。它会对不同环境中的不同人员使用相同的神经网络做出成百上千次决策,那完全是个灾难。
这些决策有可能是完全错误的。比如碰巧在下雨天你要乘坐某个交通工具,每个人可能最后都会乘坐同样的交通工具,到达相同的街道,这势必会造成拥挤。相关决策波动会导致最终结果的变化,即使那不满足独立同分布假设。
我们现在的系统仍然是假设我们处在一种理想世界中,所以总会有错误发现率存在(注:错误发现率 FDR( False Discovery Rate)是指错误拒绝(拒绝真的(原)假设)的个数占所有被拒绝原假设个数比例的期望值)。系统应该支持可以有错误发现率,而不仅仅是支持神经网络中的逻辑回归、决策树。 如果你的系统不支持,我就不会在我的公司用它。
要有一个这样能够创造市场的系统,我认为需要考虑大量的因素。所以我们会将经济学引入我们的系统,我们需要拥有消费者和生产者双向的连接,而不是仅仅建立一个可以让人们上传数据并从中获取答案的平台,而不建立一个实际系统。
在今天,不确定性依然存在。我们在统计学中谈论的 Bootstrap、贝叶斯理论、Jackknife(刀切法)以及其他原则都还没有在计算机科学系统内部建立。
它们只是输入输出,给出一条 ROC 曲线就好像已经完成了其实本没有完成的工作。所以要如何将智力结合到其中呢?要怎样解决他们两者之间不连贯的事实?这是非常关键的问题,我们必须解决这一点,并且必须假设这些问题可以通过计算机科学进行处理。
谈到抽象,人类其实非常善于发现抽象。举个例子,比如我可以发明一个新词汇“Blecch”,然后说一些关于“Blecch”的事情,你就可以知道和它有关的各种各样的事。你可以通过抽象进行推理,事实上也正是因为我们可以创建抽象概念,计算机科学才可以发展的这么好。
我的儿子非常擅长发现类比、隐喻以及那些有趣的东西,这些都会在他的大脑中形成一个新的抽象。但神经网络和那个差的太远了,神经网络必须要先看到大量的数据,最终才能发现一个新特征,或者如果有人非要称其为抽象也可以。
数据溯源(Provenance),这非常重要。实际上我对数据科学非常感兴趣。在医疗系统中,有很多误报(假阳性)导致很多死亡的案例。在我儿子出生的时候,有一些错误的成像结果,那是一个误报。如果我们相信了那条决策路线,就可能会走一个非常危险的程序,甚至杀死胎儿。我认为那也可能发生在你身上,我计算的结果是在过去的几年中,由于误报,每天大概有 20 个胎儿会被杀死。
误报和不好的统计数据无关,而是与错误的报告结果有关。在某种情况下进行计算的数据,实际上在相同情形下用于新的成像机器时是不准确的。那听起来是一个讨厌的数据库问题。但就是那个东西让模型有时难以发挥作用。
关于长期目标,人类非常善于追求长期目标,比如选择职业、买房。而我们的机器却并不具备实现长期目标的能力。不要跟我说强化学习,那也没有长期目标。
实时性能这一目标,我想那些设计自动驾驶汽车的人应该认识到了它的重要性,而其他人还没有意识到这正是我们要考虑的关键部分。这也不是传统 AI 的一部分。
如果你是一个真正有雄心的系统人员,这些都会是亟待解决的重大问题,并且大多还是很少受到关注或者正在受关注但还需要一段时间才能解决的问题。
▌ 机器学习与市场的创造性
我的一些观点是基于我的研究和在公司的经历形成的。今天我将向大家分享两个观点。
就我实际所做的工作而言,我只是一个理论研究者,所以关于这些神经网络发展的良好势头,我都乐于看着它们发生,但当我看到所有人都在扎堆朝着一个方向前进时,我就会寻找其它方向。我现在做的所有工作都是在证明收敛率和随机性的定理,你要是看过我的主页就会知道我这些天有多兴奋,但我形成这些观点却是基于在公司的(实践)经历而不是通过证明它们。
United Masters 公司是一个美国音乐人服务平台,它在 2017 年 11 月宣布成立。现在音乐人非常多,创作的音乐也非常多,但除了少数几个掌握权力的人之外,大多数音乐人的第一笔订单并不会赚钱,音乐创作实际上没有得到报酬。
发生这种状况的原因有很多,比如我们处在一个并不景气的市场,而如果连接生产者和消费者的经济的话,就会产生很多价值。它不像之前的唱片公司一样,在生产者和消费者之间有中介存在,那在这种模式下不会有效。所以你必须做些别的什么,就像 Uber 那样,或者其他你看到的真实的机会。
United Masters 已经和 Spotify 跟 Youtube 等公司建立了合作关系,并且获得了所有数据。他们会了解任何艺术家,不仅仅有碧昂丝那样的世界级歌手,还有成百上千个不太出名的艺术家,然后了解有哪些用户在听他们的音乐。他们提供给艺术家展示的机会:我知道我不是非常出名,但我知道佛罗里达州有一万人喜欢定期收听我。
这种口碑就意味着如果我去那里举办一场音乐会,我就可以赚两万五千美元。一年我可以做三到四次,那就是十万美元的薪水。我不必再做一个出租车司机,然后每周只有周末才有时间创作音乐。我实际上可以成为一个真正活跃的全职音乐家,很多人都可以这样。这就可以创造一个市场,你知道谁在听你的音乐,然后你就可以做得更多。
这实际上就是在生产者和消费者之间建立了连接。有了这种连接,一旦数据流通过,商品买卖就可以更流畅。所以艺术家可以说你只要付两万美元我就可以在你婚礼上表演,或者你是我的一个超级粉丝,你想来后台…所有这些商品的形式都可能出现,而公司实际上就提供了这种可以赚钱的方式。他们提供这些平台当然也应该得到一些钱,当然那到不了像一个标准代理人一样可以获取百分之五十的费用,不过百分之十也差不多,所以你知道你的音乐大师梦真的有希望了。
这家公司的 CEO 是 Steve Stoute,他是个了不起的人,也是我曾见过的最聪明的人之一。他曾在索尼旗下的唱片公司工作,后来创建了 Translation 广告公司,并且完成了很多实际的东西。他了解很多音乐人,Steve 的经历以及他的音乐背景,让他刚好处于一个可以将音乐、技术和人联系在一起的位置。我认为我们的社区可以参与这种活动是非常令人激动的,而 Steve 就刚好给出了这把钥匙。
去年我曾请他做一个开场演讲。那场演讲的主题是关于 Hip-hop ,自我赋权和解放,创造力以及这些该如何和数据科学联系起来。
▌ 机器学习与数据共享
现在还有一个数据共享的问题。
所有这些都还只是想法,如果我有时间的话就会进行实验,所有这些都是想法的实验。这些都只是我的一些研究建议,我的团队可能会做的。我们这些时间主要是证明定理,但这里还有一个数据共享的想法实验。
数据共享不是“AI”的问题,但却是现实世界的“II”问题。很多公司都有数据,如果可以将它们放到一起,那将对他们有用,但这通常不被允许。法律上不允许出于很多原因,比如,在某天一个公司可能会遭受入侵或欺诈攻击,但这可能同时发生在所有公司,也可能只针对特定的公司。
如果将每个人的数据都汇总起来,你就可以构建世界上最好的分类器,并且可以让系统受欺诈的程度保持的相当低,但人们不会那样做。为什么呢?很多原因。你要怎样激励他们开始分享数据?你把你的数据发送给我,是因为我是个值得信赖的中心人员,我会通过密码机制或其他方式保护你的数据。
我会获取你的数据,然后构建一个完美的分类器,然后再把它们送回去。我不会和任何人分享你的数据。但那并不是很有趣,因为可能我收到的数据中有欺诈数据。对公司来说,如果他们把真实的数据放到系统中,别人会得到比他们更多的优势,所以他们不会发送高质量的数据,他们不傻。
那他们应该发送的数据质量要多高?系统应该有什么激励机制来让他们衡量要发送数据的质量?这还涉及到隐私问题,他们的律师就会一直强调不要发送数据。所以这里从机器学习的视角来说,有一种方式就是你让每个公司自己决定要发送的数据质量或者隐私,或者其它想要对数据进行的操作。比如,他们要把噪声加到数据中,然后才会放心地把数据交出来。他们对这样有些差异化的私人系统会感到满意。
现在数据到了我这里,我会用所有这些数据构建一个分类器,然后看这个分类器在测试集中的表现如何。之后我要做的是留出一个公司的数据,然后用其他公司的数据做训练集得到一个分类器,然后看分类器效果多好。然后对比留出不同公司数据后得到的分类器。如果在某个公司数据是训练集时,得到的分类器效果最好,就说明这个公司提供的数据是好的。
我可以仅仅通过在经典 Handout 方法中的一个损失函数量化数据的好坏。我现在要为每个公司做的是每次留出它们一个,然后就知道他们发给我的数据有多好,他们觉得要给我发多好的数据,以及数据差异有多大。并且一旦我知道了这些,我就可以进行评估,现在我做的是世界上最好的分类器。但我会把模型或者预测结果,根据它们发给我的数据质量返还给他们。
这也可以说是经济学,我设定了一个博弈,有一些激励的概念,并且可能存在纳什均衡,而不是说谁都不发高质量的数据。但这个提议或许会是一个研究,可能不会有结果。
总之,如果很多事情你能摆脱传统的思考角度,那么这个社区将有很多路可以走。我不认为只靠深度学习的那群人可以实现那个目标。
完整视频地址:https://www.youtube.com/watch?v=4inIBmY8dQI