上周四晚间,亚马逊公布了2017年第四季度以及全年业绩报表,财报中诸多华丽的数字远超华尔街的预测。也正因为如此,亚马逊在周五股价大涨,盘中一度创下每股1498美元的历史最高价,市值也一度突破7000亿美元关口。亚马逊股价最后报收1429.95美元/股,涨幅2.87%,收盘市值为6891亿美元。
图:亚马逊创始人兼CEO贝索斯图:亚马逊创始人兼CEO贝索斯
需要提及的是,以亚马逊创始人兼CEO贝索斯持有近7900万股亚马逊股票计算,其拥有的市值超过1100亿美元(约合7100亿元人民币),远超长期霸榜全球首富的比尔盖茨,稳坐全球新首富(比尔盖茨的净资产在900亿美元左右)。亚马逊成立于1995年,距今已有23年的历史。近年来,亚马逊如何一路高歌,成为全球市值前三的科技巨头?让我们一起扒一扒亚马逊成功背后的故事。
Thirumalai将这一点铭记于心,他约见了贝佐斯,探讨了他的年度计划会议。他提出了如何在机器学习方面更加积极的想法。但他认为,彻底重建现有系统的风险可能太大,但经过20年的调整,机器学习已经在图像和语音识别这两个不相关的领域发挥了最佳效果。他说:“没有人真的把深度学习应用到产品推荐的问题当中,但出其不意的是,结果却令人惊讶的好。因此,这需要我们对自己更有信心。”Thirumalai还没有完全准备好,但是贝佐斯想要更多。因此,Thirumalai分享了他更前卫的选择,即利用深度学习来改进推荐的工作方式。这需要他的团队学会他们尚未掌握的技能,创造出还未出现的工具,以及研究出还没有人想到过的算法。贝佐斯喜欢这个选择(尽管还不清楚他听到时是否发出了他标志性的笑声),所以Thirumalai重写了他的新闻稿并开始工作。
尽管这些高管领导都比较推崇亚马逊的“单线程”团队文化,即每一团队独家拥有自己所使用的技术。但在发展人工智能业务的关键时期,各个团队开始了跨项目的合作。各团队内的科学家们负责解决棘手的问题,并跟其他的团队分享自己的解决方案。公司内的“人工智能小岛”开始互相联系。随着亚马逊对人工智能项目的野心不断增大,其所面临的挑战也越来越复杂,而这也为亚马逊吸引了顶尖的人工智能人才,尤其是那些希望看到自己的工作能够产生直接影响的人。这填补了亚马逊在纯研究工作中的人才缺口。因为亚马逊一直倡导创新要以客户服务为导向的这种公司文化。
亚马逊喜欢用“飞轮”(flywheel)这个词来形容它庞大业务的各个部分是如何像一个永动机一样进行运作。它现在有了一个强大的人工智能飞轮,作为公司的一部分,机器学习的创新推动了其他团队的工作进程,而其他团队便可以开发产品或提供服务来影响另外的团队,甚至是整个公司。此外,将机器学习平台作为付费服务提供给外部其他公司,让这项工作本身变得有利可图,在某些情况下,亚马逊还可以获取更多的外部数据来进一步提高其技术水平。
亚马逊从一个深度学习的追随者成为了一个主导者,这背后需要大量的“六页纸文档”项目的开发。这种转变的结果在整个公司都随处可见,包括目前完全在一个全新的机器学习基础平台上运行的推荐系统。亚马逊能够更加精确地建议你接下来应该阅读什么,你应该在购物清单中添加什么商品,以及你今晚可能会想看什么电影。今年,Thirumalai开始了一项新的工作——主管亚马逊搜索,他打算用深度学习来改造这个服务的各个方面。
华盛顿大学计算机科学教授佩德罗·多明斯说:“如果你在七、八年前问我,亚马逊在人工智能领域有多么强大,我可能会说,‘他们没有多强大’,但他们的确一直在持续努力之中。现在他们正成为人工智能领域不可小觑的一股力量。”
也许他们已经成了一股势不可挡的力量。
Alexa效应与Echo音箱
因为亚马逊缺乏人才,它利用自己雄厚的财力来收购有技术专长的公司。林普说:“在开发Alexa的早期,我们收购了很多公司。”2011年9月,亚马逊收购了Yap公司,这是一家语音文本公司,在将口语转化为书面语言方面很出色。2012年1月,亚马逊收购了英国剑桥的Evi公司,该公司的软件可以像Siri那样响应语音请求。2013年1月,亚马逊收购了一家专门从事文本转为语音业务的波兰公司Ivona,该公司提供的技术让Echo拥有对话能力。
但是亚马逊的保密文化阻碍了它吸引学术界顶尖人才的努力。它的其中一个潜在招募对象是亚历克斯·斯莫拉,他是这个领域的超级大碗,曾在雅虎和谷歌工作过。亚马逊网络服务公司的深度学习和人工智能的总经理马特·伍德说:“他确实是深度学习领域的教父之一。”(谷歌学术上斯莫拉的学术文章的引用超过9万次。)亚马逊的高管们甚至不会向他或其他候选人透露他们将来的工作计划。斯莫拉拒绝了这个工作邀请,选择在卡内基梅隆大学负责建立一个实验室。
即使亚马逊没有公布太多这个项目的开发细节,也引起了罗希特·普拉萨德的兴趣,他是一位受人尊敬的语音识别科学家,在波士顿一家名为Raytheon BBN的科技公司就职。(亚马逊让他在自己的家乡建立了一个团队,这对于吸引他来亚马逊就职有所帮助。)他认为亚马逊缺乏专业知识是它的一个特征,而不是缺陷。他说:”这里是一块尚待开拓的土地。谷歌和微软多年来一直致力于语音技术的研究。 在亚马逊,我们可以白手起家,解决难题。”2013年,他入职亚马逊后便直接加入了Alexa的项目。他表示:“这款设备目前只在硬件阶段可行,想要搭载语音技术还为时尚早。”
Echo智能音响中最棘手的部分是一种被称为远场语音识别的技术,它涉及到识别并理解与麦克风保持一定距离的语音指令,即使这些指令会受到环境噪音或其他声音的影响。这要求亚马逊在技术上有新的突破,并且从整体上而言,也提升了亚马逊在机器学习方面的竞争力。一个很有挑战性的因素是,这款设备不能浪费太多时间去思考你说的话。它必须把音频发送到云端,并迅速给出一个答案,让人感觉像是正在进行一段对话,而不是反应慢到让人尴尬得觉得自己在跟一个好像快睡着的人聊天。构建一个能够在嘈杂的环境中理解指令,并给出响应的机器学习系统需要大量的数据。亚马逊能从哪里得到这些数据也是一个问题。
他的团队利用这些资源创建了一个平台,这个平台本身就是一笔宝贵的资产,超出了它用于Echo研发工作的价值。Alexa高级首席科学家Spyros Matsoukas说:“一旦我们将Echo开发成一个远场语音识别设备,我们就看到了做更大事情的机会——我们可以将Alexa的应用范围扩大到语音服务。”Spyros Matsoukas曾与普拉萨德一同在Raytheon BBN公司工作。(他当时的工作包括美国国防部高级研究计划局一个名为“Hub 4”的的项目,该项目利用广播电视新闻和拦截的电话来推进语音识别和自然语言理解的水平,这对于Alexa项目来说简直就是神助攻。)他们扩展Alexa应用范围的一种直接方式是允许第三方开发者创建他们自己的“语音技术迷你应用程序”。这也被称为“技能”,能在Echo智能音响上运行。但这仅仅只是个开始。
一旦有数百万客户(亚马逊不愿透露具体数量)开始使用Echo音箱,或者是使用其他基于Alexa助手的设备,亚马逊转型的另一个关键环节就开始了。亚马逊开始积累大量的数据,这很可能是所有谈话驱动设备所能收集的最大的交互集合。这些数据对于那些潜在的受雇员工来说是一个强大的诱惑。突然间,亚马逊迅速成了那些各方争抢的机器学习专家们想要工作的地方。去年加入亚马逊的机器学习副总裁Ravi Jain说: “让Alexa对我如此有吸引力的原因之一是, 一旦你在市场上有了一个设备, 你就有了反馈的资源,不仅是用户的反馈数据,还有那些对改善一切都至关重要的实际数据——尤其是支撑这一切的平台。”
因此,随着越来越多的人使用Alexa,亚马逊获得的信息不仅能够使系统性能更好,而且还强化了它自己的机器学习工具和平台, 并使其成为机器学习科学家的一个热门工作地点。
飞轮开始旋转。
亚马逊AWS:更聪明的云端
014年,亚马逊开始向Prime客户销售Echo智能音箱。也是那一年,当时负责管理亚马逊网络服务数据库和分析业务的Swami Sivasubramanian开始对机器学习感兴趣。他14年携家人正在印度旅行时, 由于时差的问题,再加上他出生不久的女儿不时大哭,他发现自己深夜在电脑前摆弄谷歌的 Tensorflow 和Caffé等工具, 这是 Facebook 和许多学术界专家青睐的机器学习框架。 他得出了一个结论,那就是将这些工具与亚马逊的云服务结合起来可能产生巨大的价值。他认为,通过使云计算中的机器学习算法变得更容易,公司可能会挖掘出潜在的一系列需求。他说:“我们每个月都会为数百万的开发者提供服务。其中大多数人不是麻省理工学院的教授,而是没有机器学习背景的开发者。”
图:亚马逊人工智能副总裁斯Swami Sivasubramanian,首批意识到将人工智能工具集成到公司云服务中将会产生商业价值的人之一。在他下一次与杰夫·贝佐斯的进行工作反馈中,他提交了具有重大意义的六页纸文档。在某种程度上来说,这份文档是一张为亚马逊网络服务增加机器学习服务的蓝图。但是,Sivasubramanian认为这具有更广阔的前景:AWS将会成为整个技术领域机器学习活动的中心。
从某种意义上来说,向成千上万的亚马逊云用户提供机器学习是大势所趋。AWS的机器学习经理伍德说:“当我们第一次整合AWS最初的商业计划时,我们的任务是采用只有少数资金背景雄厚的组织才能获得的技术,并尽可能扩散这些技术。我们在计算、存储、分析和数据库方面已经成功地做到了这一点,现在,我们在机器学习方面也采取了同样的方法。”使之更简单的是,AWS团队可以借鉴公司其他团队积累的经验。
AWS在2015年首次推出“亚马逊机器学习”,允许像C-Span这样的客户建立一个私人的面部图片列表,伍德说。Zillow用这一功能来估算房价。Pinterest将其用于视觉搜索。几家自动驾驶创业公司正在利用AWS机器学习技术,通过数百万英里的模拟道路测试来改进产品。
2016年,AWS发布了新的机器学习服务,该服务更直接地借鉴了Alexa的创新,即一个名为Polly的文本到语音的组件,以及一个名为Lex的自然语言处理引擎。这些产品让AWS的客户,不论是Pinterest和Netflix这样的巨头,还是小型创业公司,均可以使用该服务建立自己的迷你“Alexa”助理。第三个涉及视觉的服务Rekognition,借鉴了Prime Photos所做的工作,这是亚马逊一个相对不太有名的项目,其试图和谷歌、Facebook和苹果等照片产品一样,在照片识别领域实现同样的深度学习水平。
这些机器学习服务既是强大的收入来源,也是亚马逊的人工智能“飞轮”的关键,因为像美国国家航空航天局和美国橄榄球联盟这样截然不同的客户都在花钱让他们的机器从亚马逊上学习。随着企业在AWS中建立起重要的机器学习工具,他们最后转向与亚马逊竞争的云计算业务的可能性变得微乎其微。
比如Infor这家为企业客户创建商业应用程序的公司,其估值已经达到了数十亿美元。它最近发布了一款名为Coleman的新应用(以电影《NASA无名英雌》中一位数学家的名字命名),允许客户自动处理各种流程,分析性能,并通过对话界面与数据交互。它没有从零开始构建自己的机器人,而是使用AWS的Lex技术。Infor的高级副总裁Massimo Capoccia说:“不管怎样,亚马逊已经做出来了,我们为什么要花时间在这上面呢?我们了解我们的客户,我们可以使亚马逊机器人适用于他们。”
AWS在以太网上的主导地位,也给予了其战略优势以打败竞争对手,尤其是谷歌,后者曾希望利用其机器学习的领导地位,在云计算领域赶上AWS。的确,谷歌可能会在其服务器上为客户提供超快速、机器学习优化的芯片。但是,在AWS上的公司可以更容易地与使用相同服务的公司进行交互,并向它们销售产品。DigitalGlobe的首席技术官Walter Scott谈及他的公司为什么使用亚马逊的技术时说:“这就像威利·萨顿所说的,他之所以抢劫银行,是因为那里有钱。我们使用AWS进行机器学习,因为我们的客户也在这里。”
去年11月,在AWS Invent大会上,亚马逊为其客户推出了一个更全面的机器学习产品:SageMaker,一个成熟且超级易用的平台。它的创造者之一就是亚历克斯·斯莫拉,这位学术文章被引次数达9万次的机器学习领域的超级大腕,在五年前拒绝了亚马逊的工作邀请。当斯莫拉决定重返业界时,他想要帮助创建强大的工具,让日常软件开发人员能够使用机器学习。所以他去了一个他觉得他会产生最大影响的地方。他说:“亚马逊好到不容错过。你可以写一篇关于某物的论文,但如果你不将它构建出来,就没有人会使用你的漂亮算法。”
当斯莫拉告诉Sivasubramanian,将机器学习传播给数百万人的工具比再发表一篇论文更重要的时候,他收到了一个惊喜。Sivasubramanian说:“你还是可以发表你的论文!” 没错,亚马逊现在在允许科学家发表文章方面的限制更少。帮助亚马逊制定了更为开放的指导方针Spyros Matsoukas说: “这不仅有助于招募顶尖人才,也为亚马逊的研究提供了可见性。”
现在还不知道AWS的数百万用户是否会开始使用SageMaker,以在他们的产品中嵌入机器学习。不过,只要是使用了SageMaker的客户都会发现,自己在作为机器学习服务提供商的亚马逊身上投入了大量资金。此外,该平台也是精打细算,甚至包括Alexa团队在内的亚马逊内部的人工智能团队也表示,他们打算使用提供给外部公司的同样的工具集来使用SageMaker。他们相信,通过为他们的项目打下基础,可以让他们专注于更复杂的算法任务,从而为他们节省大量的工作。
即使只有AWS的一部分客户使用了SageMaker,亚马逊也会发现自己拥有大量关于其系统运行情况的数据(当然,不包括客户自己保留的保密信息)。这将带来更好的算法、更好的平台、更多的客户。“飞轮”在高速运转。
无处不在的人工智能
随着机器学习的改革升级到了一定阶段,亚马逊的人工智能技术现在已经应用到了公司的许多团队当中,这让贝佐斯感到非常满意。虽然亚马逊没有人工智能中心,但有一个部门专门负责机器学习的普及和支持,公司还进行了一些应用研究,将新科学加入到公司的项目中。核心机器学习小组由拉尔夫·赫布里希领导,他曾在微软的必应团队工作过,之后在Facebook工作了一年,2012年时被亚马逊挖走。他说:“在公司内部有一个拥有这样的一个社区的地方是很重要的。”(当然,这个项目也来自于贝索斯批准的一个六页纸文档。)
他的部分职责包括培育亚马逊快速增长的机器学习文化。由于该公司以客户为中心的运营方法——解决问题而不是进行那些毫无价值的研究——亚马逊的高管们确实承认,他们在招聘时总是倾向于那些对勇于开拓新事物感兴趣的人,而不是那些追求科学突破的人。Facebook的勒邱恩则用另一种方式说:”不领导知识分子先锋, 你也可以做得很好。”
不过,亚马逊也在效仿Facebook和谷歌,他们带头培训员工让其变得更适应人工智能。该公司在机器学习方面开展了内部课程,并让公司内部的专家举办了一系列的讲座。从2013年开始,该公司每年春天都会在其总部举办一次水平一流的内部机器学习会议。
赫布里希说:“刚开始的时候,亚马逊机器学习会议只有几百人参加,现在已经有几千人了。西雅图亚马逊总部最大的会议室已经容纳不下这么多人了,所以我们的举办场所从一变成了六。”亚马逊的一位高管表示,如果会议规模变得更大,就不应该将其称为“亚马逊机器学习大会”,它就应该被称为“亚马逊”。
赫布里希的团队继续尝试着将机器学习推广到公司的每一个角落。例如,打包团队希望想要更好地预测,八种盒子大小,他们应当选择哪一种适配客户订单,所以他们向赫布里希的团队寻求帮助。他说:“这个团队不需要自己的科学家团队,但它需要这些算法,并且需要能够很容易地使用它们。”
在另一个例子中,大卫·林普指出了亚马逊在预测多少客户可能购买新产品方面的转变。他说:“我已经在消费电子领域工作了30年,其中有25%的预测是通过人类的判断、电子表格和一些魔术贴球和飞镖来完成的。自从我们在预测中开始使用机器学习以来,我们的预测错误率显著下降。”
尽管如此,赫布里希的团队有时也会将尖端科学应用到一个问题上。该公司的食品杂货配送服务Amazon Fresh已经运营了10年,但它需要一种更好的方式来评估水果和蔬菜的质量,因为人类的评估速度太慢,而且还会前后不一致。他在柏林的团队建立了传感器装载的硬件和新的算法,弥补了系统无法触摸食物和闻食物气味的能力。他说:“三年后,我们将会做出一个原型,可以比以前更可靠地判断果蔬质量。”
当然,这样的进步可以渗透到亚马逊的整个生态系统中。就拿亚马逊最近向公众开放的亚马逊Go无人超市来说,它是一家基于深度学习的无人杂货店。亚马逊Go的技术副总裁迪力普·库马尔说:“作为AWS的客户,我们从中受益良多。但AWS反之也受益于我们。”他举了一个例子,亚马逊Go有一个独特的系统,有数百台摄像头来收集数据,追踪顾客的购物活动。他的团队的在工作中的创新也影响了AWS一项名为Kinesis的服务,该服务允许用户将多个设备的视频传输到亚马逊云端,在那里他们可以对视频进行处理和分析,并使用视频来进一步改进他们的机器学习算法。
即使有还没有使用自家公司的机器学习平台的亚马逊服务,它也可以成为亚马逊的Prime Air无人机送货服务的积极参与者,这一服务目前仍处于原型阶段,它必须单独构建人工智能,因为无人驾驶飞机无法依靠云端连接。但它仍然从“飞轮”中获益良多,既能从公司的其他团队汲取知识,又能搞清楚该使用什么工具。
Prime Air的副总裁Gur Kimchi 说:“我们认为这是一个菜单——每个人都在分享他们的菜肴。”他预计,他的团队最终将拥有自己的美味菜单。他说:“我们正在学习的课程以及我们在Prime Air项目中解决的问题,肯定会引起亚马逊其他团队的兴趣。”
事实上,这似乎正在发生。亚马逊机器人团队的首席科学家贝斯·马库斯说:“如果有人在公司的某个部门看到一张图片,比如Prime Air或亚马逊Go,然后他们因此学到一些东西并创建了一个算法,他们会和公司里的其他人谈论这个问题。所以我的团队中有人可以利用这种算法,来完成一些事情。
图:亚马逊机器人首席科学家贝斯·马库斯看到了与公司日益壮大的人工智能专家合作的好处。一个以产品为中心的公司是否有可能超越那些拥有深度学习领域的顶尖人才的竞争对手?亚马逊正在为此做准备。艾伦人工智能研究所的首席执行官Oren Etzioni说:“尽管亚马逊正在追赶,但他们发布的产品发布非常令人难以置信。亚马逊是一家世界级的公司,它创造了世界级的人工智能产品。”
“飞轮”一直在旋转,还有许多的六页纸的文档仍在酝酿之中。这将会为亚马逊带来更多的数据,更多的客户,更好的平台,以及更多的人才。
如果你问Alexa,“亚马逊在人工智能领域的表现如何?”
你猜它会回答什么?杰夫·贝佐斯的笑声也许能告诉你答案。
选自:Wired
编译:网易智能
参与:Rosie