公众号/
编辑/绿萝
在过去的 18 个月中,人工智能的采用率猛增。除了为《哈佛商业评论》撰写基础文章的 Joe McKendrick 之外,从事 AI 工作的专业人士也很容易证实这一说法。谷歌搜索似乎也参与了这个不那么秘密的搜索:当提示「采用人工智能」时,它的自动完成功能「在过去 18 个月内飙升」。
我们所知道的轶事证据和调查似乎都指向同一个方向。举个例子:O’Reilly 于 2021 年初进行的「企业 2021 年人工智能采用调查」的答复是 2020 年的三倍,企业文化不再是采用人工智能的最大障碍。
使用人工智能的行业。(来源:www.oreilly.com)
换句话说,越来越多的人在使用人工智能,它现在被认真对待,成熟度也在不断提高。这都是好消息。这意味着人工智能不再是研究人员玩的游戏——它正在被应用,成为微软和亚马逊等公司的中心舞台。
以下是 venturebeat 预计在 2022 年应用人工智能将建立的支柱。
AI 芯片
通常,在讨论 AI 时,人们会考虑模型和数据,这是有原因的。这些是大多数从业者认为他们可以施加一些控制的部分,而硬件仍然大部分是看不见的,其功能被认为是固定的。但真的是这样吗?
所谓的 AI 芯片,即旨在以最佳方式运行 AI 相关工作负载的新一代硬件,正在经历爆炸式增长和创新。谷歌和亚马逊等云计算的主流企业正在为其数据中心构建新的 AI 芯片——分别为 TPU 和 Trainium。英伟达一直主导着这个市场,并围绕其硬件和软件生态系统建立了一个帝国。
Google 数据中心之一中的张量处理单元 (TPU)。(来源:谷歌)
英特尔正在迎头赶上,无论是通过收购还是通过自己的研发。由于英伟达宣布的收购面临监管审查,Arm 的地位仍然有些不明朗。此外,我们有许多新玩家在他们的采用过程中处于不同的状态,其中一些——比如 Graphcore 和 SambaNova——已经达到了独角兽的地位。
这对于应用 AI 来说意味着,选择在何处运行 AI 工作负载不再仅仅在 Intel CPU 和 Nvidia GPU 之间做出决定。现在有很多参数需要考虑,开发不仅对机器学习工程师很重要,对人工智能从业者和用户也很重要。更经济、更有效地运行 AI 工作负载意味着将有更多资源可用于其他地方,并加快上市时间。
MLOps 和数据中心性
选择运行 AI 工作负载的硬件可以被视为 AI 模型开发和部署端到端流程的一部分,称为 MLOps——将机器学习带入生产的艺术和科学。与 AI 芯片、标准和项目(如 ONNX 和 Apache TVM)建立联系,可以帮助缩小差距,减轻机器学习模型部署到各个目标的繁琐过程。
到 2021 年,随着从 AI 操作中吸取的经验教训,重点现在将从闪亮的新模型转移到可能更加平凡但实用的方面,例如数据质量和数据管道管理,所有这些都是 MLOps 的重要组成部分。与任何学科一样,MLOps 在市场上看到了许多产品,每个产品都专注于不同的方面。
有些产品更侧重于数据,有些产品更侧重于数据管道,还有一些产品则两者兼而有之。一些产品监控和观察诸如模型的输入和输出、漂移、损失、精度和数据召回准确度等内容。其他人围绕数据管道做了类似但不同的事情。
以数据为中心的产品可以满足数据科学家和数据科学领导者的需求,也可能满足机器学习工程师和数据分析师的需求。以数据管道为中心的产品更面向 DataOps 工程师。
2021 年,人们试图给与 MLOps 相关的各种现象命名,分割 MLOps 领域,应用数据版本控制和持续机器学习,并对数据执行测试驱动开发等。
然而,我们认为最深刻的转变是强调所谓的以数据为中心的人工智能。著名的人工智能思想领袖和实践者,如 Andrew Ng 和 Chris Ré 已经讨论过这个概念,其核心非常简单。
我们现在已经达到了机器学习模型得到充分开发并且在实践中运行良好的地步。事实上,集中精力从头开始开发新模型或微调至完美并没有多大意义。根据以数据为中心的观点,人工智能从业者应该做的是专注于他们的数据:清理、提炼、验证和丰富数据可以大大改善人工智能项目的结果。
大型语言模型、多模态模型和混合 AI
在讨论应用 AI 时,大型语言模型(LLM)可能不是第一个想到的东西。然而,知情人士认为,LLM 可以内化语言的基本形式,无论是生物学、化学还是人类语言,我们即将看到 LLM 的不寻常应用增长。
为了支持这些说法,值得一提的是,我们已经看到围绕 LLM 构建的各种生态系统,主要是 OpenAI 与 Microsoft 合作推出的商业化 GPT-3 API。这个生态系统主要由提供文案服务的公司组成,例如营销文案、电子邮件和 LinkedIn 消息。他们可能还没有点燃市场,但这只是开始。
我们认为 LLM 将在 2022 年通过多种方式获得更多采用并带来创新产品:通过更多选项来定制 LLM,例如 GPT-3;通过更多构建 LLM 的选项,例如 Nvidia 的 NeMo Megatron;并通过 LLMs-as-a-service,例如来自 SambaNova 的产品。
正如 VentureBeat 自己的 Kyle Wiggers 在最近的一篇文章中指出的那样,多模态模型正在迅速成为现实。今年,OpenAI 发布了 DALL-E 和 CLIP,这两种多模态模型被研究实验室声称是「朝着对世界有更深入了解的系统迈出的一步」。如果法学 LLMs 可以通过,我们可以合理地期望在 2022 年看到多模态模型的商业应用。
另一个重要方向是混合人工智能,即在机器学习中注入知识。英特尔的 Gadi Singer、LinkedIn 的 Mike Dillinger 和混合智能中心的 Frank van Harmelen 等领导者都指出了知识图谱形式的知识组织对于人工智能未来的重要性。混合人工智能是否会在 2022 年产生应用人工智能应用程序还有待观察。
AI 在医疗保健和制造业中的应用
让我们总结一些更接地气的内容:2022 年应用 AI 的前景广阔的领域。O’Reilly 的《2021 年企业 AI 应用调查》将技术和金融服务列为引领 AI 应用的两个领域。这并不奇怪,因为科技行业愿意「吃自己的狗粮」,而金融行业也愿意利用其雄厚的资金来获得每一寸竞争优势。
但是这两个行业之外会发生什么呢?O’Reilly 的调查将医疗保健列为人工智能采用的第三个领域,这与我们自己的经验是一致的。正如《人工智能现状》作者 Nathan Benaich 和 Ian Hogarth 在 2020 年指出的那样,生物学和医疗保健正在见证他们的人工智能时代。这波浪潮已经开始,而 COVID-19 的出现进一步加速了这一浪潮。
「现有的制药公司在很大程度上受到先验假设的驱动,例如说,[我认为这个基因是导致这种疾病的原因,让我们起诉它并弄清楚这是否属实。] 然后还有更多软件驱动的人处于这个新的制药时代。他们主要看大规模的实验,同时提出很多问题。以一种公正的方式,他们让数据绘制了他们应该关注的地图,」Benaich 在总结 AI 驱动的方法时说。
Benaich 补充说,验证新时代制药方法是否有效的唯一方法是,它们是否可以产生实际证明在临床上有用的候选药物,并最终使这些药物获得批准。在这些「新时代制药」公司中,Recursion Pharmaceuticals 于 2021 年 4 月 IPO,Exscientia 于 2021 年 9 月提交 IPO。它们都有通过基于机器学习的方法产生的资产,这些资产实际上已用于临床。
至于制造业,在人工智能采用的众多领域中,我们选择强调它有几个原因。首先,它面临着人工智能可以缓解的劳动力短缺问题。根据 Deloitte 和制造业研究所发表的一项研究,到 2030 年,多达 210 万个制造业工作岗位可能会空缺。执行自动化实物产品检查等任务的人工智能解决方案就属于这一类。
其次,工业应用的本质要求以非常精确的方式将大量数据与物理世界相结合。有些人已经指出,这非常适合混合 AI 方法。
最后,但并非最不重要的是,硬数据。根据 The Manufacturer 2021 年的一项调查,65% 的制造业领导者正在努力试点 AI。仅在仓库中的实施预计将在未来五年内达到 57.2% 的复合年增长率。
参考内容:https://venturebeat.com/2021/12/29/what-will-applied-ai-look-like-in-2022/