公众号/DeepTech深科技
图丨李佳发朋友圈表示,这是她与李飞飞加入 Google Cloud 后的第一个里程碑
在 AI 浪潮再次兴起的背景下,许多企业都对 AI 跃跃欲试,但因为相关人才在全球都呈现稀缺,企业想招人也不见得招得到,要不就是得重金聘请,像是美国顶尖 AI 科学家的年薪已经达到美国国家美式足球联盟(NFL)四分卫的水平,远远超过 NBA 球星的平均薪水。
因此,对有意尝试或导入 AI 的企业来说,“让机器学习得以自动化”具有很大的吸引力,但从另一方面来看,它也很可能引发一场大逃杀,而业界也已经出现一种声音:Google Cloud AutoML 将堵死一票创业公司的活路。
就像C语言或是AutoCAD,自动及辅助是两大精神
人类一直很擅长于自动化这件事,生活里有各式的机器都帮助人类降低了劳动,不论是工厂里的机械手臂,甚至是家里的洗衣机、电饭锅都可以说是自动化的多种表现,这些工具减少了人工劳动的要求,并加速任务完成,追求的是效率提升。
目前,企业想要建立 AI 模型仍是费时耗力,如果现在能把 AI 也给自动化,还真是不得了,各行各业不再需要这么多的 AI 人才也能打造自己的 AI 模型。
NVIDIA 创办人黄仁勋在去年的 GTC 台北场接受 DT 君采访时甚至表示:未来不需要这么多软件人才,因为写程序这件事可以交给 AI 来做。因此,许多人都在想着如何让打造 AI 这件事变得更轻松一点,甚至是自动化,而 Google、微软不少企业都在想这件事。
图|微软的Azure Machine learning Studio,用户可以直观地拖拽方法和流程的名称,让机器自动完成机器学习任务。(资料来源:微软)
例如,微软在 2016 年推出了 Azure Machine learning Studio,用户可以直观地拖拽方法和流程的名称,让机器自动完成机器学习任务,而 Google Cloud AutoML 也想达到类似的效果,但因为 Google 目前的 TensorFlow 是目前最多开发者、初创公司、企业使用的架构,因此 Google Cloud AutoML 一推出就引发了热烈的讨论。
但 Google Gloud AutoML 真如此厉害吗?在回答这个问题之前,必须先了解 AutoML 的起源和实质上的意义。AutoML 的概念其实源自 2012 年学术界提出一个新观念—— Programming by Optimization(PbO),字面上的意思是指以最优化程序开发,乍听之下似乎看不出个所以然,这却是一个相当创新的观念,实质上就是要解决编程时人工调校参数的问题。
不论是在开发程序或是设计程序决策时,会涉及许多参数调校的问题,以前都是人员手动调整,而 AutoML 的精神就是保留让机器自我调校的弹性,在建立 AI 模型时同样会涉及参数调校,现在同样可以把这部分的工作交给机器来做。
图丨Google Could AutoML
Google Could AutoML 服务使用了三个核心技术,分别是神经架构搜索技术(Neural Architecture Search Technology)、 learning2learn 以及迁移学习 (transfer learning) 。通过这些技术把参数以及结构的调整交给机器。运作的概念是机器利用神经架构搜索技术不断测试,找出一个好的参数+神经网络结构的组合,AI 开发人员觉得这个组合不错,认可了之后,机器就会记住,下一次就会做得更快更精准,这就是 learning2learn;或是可以将此组合转移到另外的应用场景下使用,这就是迁移学习。
LIVEhouse (LIVEhouse 旗下的“GCP 专门家”是 Google Cloud Platform 全球第二大的合作伙伴)共同创办人程世嘉指出,AutoML 在信息技术的发展堆叠上,最大的意义在于把人工智能技术的层级再提高一层,就好像 C 语言的发明,让程序设计者从此不用懂太多底层电脑的架构就可以写程序,现在使用 AI 技术也不用懂太多机器学习。
他进一步表示,Google Could AutoML 有两个意义,一是自动化,也就是超参数(hyperparameter)的调教,另一个更重要的意义是辅助化。以前要做网页设计没有工具,有了AutoCAD 之后就方便程序开发者工作,现在没有足够的机器学习背景的开发人员可以通过 Cloud AutoML 来训练定制化的机器学习模型。
“ Could AutoML 可以想成是 C 语言或是 AutoCAD 的角色,是 AI 自动化工具也是辅助工具。而且 AutoML 相较于 TensorFlow 更具扩散力,TensorFlow 是软件工程师才会用的工具,但 AutoML 把人工智能的易用性扩大到所有不太懂人工智能的人,”程世嘉一语点出重点。
由于 Google 在图像识别领域的技术已经相当领先且成熟,理所当然成为 Cloud AutoML 第一个主打的领域,通过 AutoML Vision 服务让企业只需通过拖曳界面上传影像、训练和管理模型,然后直接在 Google Cloud 上利用这些经过训练的模型,相信未来 Google 还会推出诉求其他领域的 Cloud AutoML 服务,像是语音、视频、翻译和自然语言处理(NLP)等,吸引企业付费使用。
图|Google针对机器学习领域提供三种服务。(资料来源:GCP专门家)
Google 云端人工智能与机器学习研发负责人李佳和 Google 云端人工智能与机器学习首席科学家李飞飞在 Google 博客上也表示,Cloud AutoML 除了有助提高人工智能专业人员的生产力、开展新的研究领域,还可帮助技术较不纯熟的工程师打造更强大的人工智能系统。
因此,Cloud AutoML 的重要性就在于开启“ AI 平民化(Democrazing AI)”的第一步。黄仁勋的“AI 写程序”说法并不危言耸听,虽是放眼未来的一个目标,随着越来越多的AI自动化工具出现,肯定会走到那一天。
强调解决企业商业问题的创业公司恐面临大冲击
当企业可以通过付费的 AutoML 工具或服务更快进入 AI 世界,即使不是人工智能专家也可以轻易使用上手,从 AI 的普及面来看是好事一桩,未来不论是Google、微软或是 IBM 都可能推出更多的 AI 自动化工具,企业未来就有更多的选择,不再像先前一样需要招募这么多的 AI 人才,或是花钱使用其他公司的 AI 模块或套件,所以另一个角度来看,这些大公司的策略无疑将抢走许多 AI 初创公司的生意。
而 AI 领域创业的公司相当多,从上游的芯片、算法、到下游的应用都有,其中应用又是五花八门,Google Cloud AutoML 对什么样的 AI 初创公司造成冲击?
专攻设备端芯片是一个利基市场(niche market),特别是Google、亚马逊、微软这些大公司出发点都是从云端出发,他们都需要把最后一公里接起来,因此,云端以外的芯片商机是非常大,受到 AutoML 冲击很小,越往应用端的冲击就开始增加,特别是拿企业的数据,号称以 AI 改善营运管理或做商业决策的应用,恐怕是首当其冲。
为什么呢?程世嘉指出,企业想要引入 AI 有几个流程,“建模”、“调教”和“接入企业流程”,这是最耗费专家时间和心力的几个步骤。而且企业的应用涉及行业知识(domain knowhow),而每一个行业别的差异及专业都大不相同,企业往往是因为缺乏内部的人才,选择向外寻求解决方案,但与外部第三方企业合作需要花费很多时间才能让对方了解 domain knowhow,所以当企业内部的人自己就可以通过 AutoML 服务或工具打造出 AI 模型,自然会降低使用第三方企业 AI 模块的兴趣,因此对于一些强调用 AI 帮助企业做商业决策的初创公司将是一大挑战。
业界人士对 DT 君表示,“Google 靠着 AutoML 这一招会堵住很多初创公司的路,特别是一些浅碟型的 AI 初创公司。”很多 AI 初创公司的策略通常是以 AI 人才为团队,然后包装 AI 题材,跟资本市场要钱,但是当不太懂人工智能的技术人员也能妥善运用机器学习时,这些 AI 公司的前景将从光明转为黯淡!
不过,正如上文所说的,Google Cloud AutoML 本质上是通过自动调整超参数和模型来保证算法的准确度,这也就意味着,它并没有解决当前深度学习正在面临的困境。这些困境既包括老生常谈的“黑盒子”问题,也包括最近不断涌现的深度神经网络易被人为构造的样例愚弄这样的问题。
但即便如此,对一些 AI 初创公司来说,却已是“凛冬已至”。这是《权力的游戏》中常说一句话,用它来形容 Google Cloud AutoML 的问世对当下 AI 创业热潮的影响并不为过。而对于 Google 这家曾经发表过《one model to learn them all 》(“一个模型学习一切”)的公司来说,他们的野心还大着呢,当然,其他的科技巨头也不会放慢脚步。或许就在今年,或许再久一些,人工智能的下一个重大突破还将带来杀伤力更大的凛冬。