公众号/AI前线
作者 | Vaibhav Saini
译者 | 无明
编辑 | 陈思
AI 前线导读:这篇文章将讲述搜索引擎的发展历程,从文本搜索到语音搜索,再到 AR/VR、智慧城市,以及搜索引擎的未来……
更多优质内容请关注微信公众号“AI 前线”(ID:ai-front)
想象一下,在一个星期天的早晨,你醒了过来,发现互联网消失了。
假设这一天你想看电影,去 Netflix 上看?很显然,这样不行……
碰巧你的电脑上也没有这部电影,你想搜一下谷歌看看哪家电影院有放这部电影,但很显然,这样也不行……
或许可以租个 DVD……
于是,你想跑去最近的 DVD 店,你打开了谷歌地图,但什么也搜不到……
好吧,你只能自己跑腿了。或许你可以在市场上找到一家 DVD 店。你想叫 Uber,但很显然,什么也没有……不过没关系,你可以自己开车去,但前提是用不了谷歌地图。
没有了互联网,是不是感到举步维艰?可见我们现在有多么依赖互联网和它所提供的服务。
生活在现在这样的世界,我们是幸运的。互联网几乎为我们提供了所有我们想知道的信息。互联网不仅仅帮助我们收集信息,还会按照我们需要的方式帮助我们获取信息。这就是为什么人们从互联网诞生之初就开始努力想办法通过各种方式从浩瀚的信息海洋中组织和获取各种信息。
于是,搜索引擎诞生了。
你可能意识不到,你对搜索引擎的依赖远超自己的想象。从你所在的位置附近找咖啡店,在你最喜欢的网店买衣服,或者搜索“泰坦尼克号是什么时候沉没的”,再到平息朋友间的争执,你都在使用搜索引擎。
自互联网诞生以来,搜索引擎就一直存在。第一个搜索引擎 Archie 诞生于 1990 年,由蒙特利尔麦吉尔大学的学生 Alan Emtage 创建。从那时起,数以百计的搜索引擎前仆后继,其中一些消失了,其中一些则留了下来。
这里列出了 250 多个搜索引擎,如果你好奇的话可以看一下:
https://hackernoon.com/searchpedia-a-list-of-250-search-engines-40198146adfc
现在的搜索引擎变得越来越好。像谷歌这样的搜索引擎不仅能为你提供搜索结果,还能个性化你的搜索,并提供你可能觉得有用的相关信息 (即使那不是你想要的)。
谷歌洞悉一切
那么接下来呢?
10 年之后,这些搜索引擎会是什么样子?
在这篇文章中,我们将试图找出这个问题的答案。我们不使用什么占星术,而是通过分析在塑造搜索行业中发挥重要作用的各种因素。我们将看到:
接口方面的选择;
搜索领域的变迁;
技术的市场成熟度;
支持可持续的搜索生态系统的商业模式。
系好安全带,车子要开动了!
接 口
接口是在两个或多个参与方之间实现信息流动的东西。
对于搜索引擎来说,有两个方面:一个是人,一个是机器。
好的接口可以让你:
向机器输入信息;
从机器接受输出。
因此,我们所要做的就是比较以下哪个接口在这种场景中表现得更好。
我们将考虑 3 种接口类型:
文本;
声音;
AR/VR(主要是 AR)。
为了比较它们的效率,我们取 3 个参数 (如下)。让我们来比较一下。
输入便利性:自然和即时
文本
我们已经用它几十年了,从很多方面来看,它似乎都很慢。首先,它不是即时的。我必须拿出手机 / 笔记本电脑,然后输入搜索查询,这需要花很多时间。
但这种方式比较精确,我可以准确地输入我想要搜索的关键字。
此外,对于不同的语言,文本并不会提供相同的搜索结果。是的,机器学习正在让它变得更好,但是,对很多语言来说并不是那么好。最后,文本只能提供有限的信息。
语音
我们使用语音已经很长时间了,市场上似乎在炒作这个东西。语音很方便,因为我不需要拿出设备,甚至在使用时不需要离设备很近。很多时候,比如我们忙着做饭或者开车,在这种情况下,可以使用语音。此外,我只需要大声说出想要搜索的东西,这比输入文本要方便得多。这是一种更好的基于会话的搜索,因为在使用文本搜索时,输入会话是很麻烦的。
但这种方式并不精确。当然,它每天都在进步,但仍然没有文本输入那么精确。此外,它仍然受语言本身的影响。
AR(增强现实)
这是一个相当新的概念,在撰写本文时,我们大多数人还没有使用过它。就 AR 本身而言是非常方便的,我们不需要给它太多输入,它会将周围环境的图像作为输入。因此,与其他接口相比,AR 需要大量的输入。但这些输入不一定有很大的意义,因为如果我想要找到最近的咖啡店,我无法通过打字或者语音告诉它。因此,不能将 AR 单独作为接口。
在 AR 中显示的地点位置信息
在讨论接口输入时,情境是另一个很重要的参数,它已经成为搜索领域的一个重要话题。例如,我要求搜索引擎搜索“最佳餐厅”,搜索引擎显示出世界顶级餐厅的列表,但我很有可能是在寻找一家离我很近的最佳餐厅。这就是为什么情境如此重要。
让我们从情境方面来比较这三种接口。
情境或输入效率
文本
正如我们所看到的那样,今天的文本接口只能通过 GPS 获取基于位置的情境 (或者如果我有特别提供的话)。如果我需要提供更多的情境信息,必须在搜索关键词中输入。所以,从情境方面来看,文本并不是那么好。
语音
与文本一样,语音必须通过直接输入来提供情境信息。
AR
AR 在情境方面表现最好。因为我们可以获得大量有关周围环境的信息,所以对于基于情境的搜索,AR 会成为关键的部分。
除了这些输入媒介,谷歌这样的服务也在跟踪我们的日常生活,并试图找到其中的模式,但我们可能并没有意识到或者知道。比如,我每周五都会去看电影,我的设备最终会检测到一种模式,并开始向我推荐 Google Now 上的电影。
此外,像 Behavio(http://www.behav.io/,现在被谷歌收购) 这样的项目使用传感器来判断我们在做什么,从而预测我们可能想要什么或者下一步可能要做什么,从而让服务提供商 (比如搜索引擎) 理解和预测我们的行为。
我们已经讨论了很多关于输入的东西,现在我们来关注一下输出效率。
输出效率
文本
文本具有很好的输出效率。当我搜索“如何制作蛋糕”时,我得到的结果是这样的:
我可以同时看到蛋糕、食谱和评论的图片。我还可以轻松地滚动到菜谱的任意部分。但是情境输出不是那么好,比如我正在做蛋糕,但我并没有得到任何有关如何在特定型号的烤箱中烘烤蛋糕的具体建议。
总的来说,文本的输出效率是挺好的。
语音
可惜的是,在输出效率方面,语音很糟糕。如果以“如何制作蛋糕”为例,语音搜索会给我一个循序渐进的答案。我看不到任何图片,而且浏览结果有点困难,我不能轻易地跳到任意部分 (因为我不知道接下来的部分是什么,我还必须记住很多东西)。
所以,语音的输出效率很差。
AR
AR 具有很高的输出效率。再以制作蛋糕为例,我不仅可以同时看到很多内容,而且,由于它知道我的情境,它可以根据我手头的东西 (餐具、烤箱等) 给我提供更多的信息。但是,当我需要问一些不在情境内的东西时,我还是需要使用文本或语音接口。
所以,在输出效率方面,AR 真的可以将我们的搜索体验提升到一个全新的水平。
因此,我们可以清楚地看到,这些接口都不能单独充当最终接口。我们需要的是这三者的混合体,这样就会具备很高的输入 / 输出效率和良好的情境感知因子。
所以,好的接口应该是可以连接到设备的东西,比如眼镜。眼镜可以充当 AR 接口,内置麦克风,可以接收语音命令。如果我们需要 100% 的精确度 (因为声音并不总是很精确),可以让智能手机连上眼镜,然后在手机上输入文本。
如果你想深入了解更多有关接口的讨论,请查看此链接:
https://medium.com/@vaibhavsaini_67863/5-ways-well-interact-with-computers-in-future-b8e3c8dc7d03
现在,我们对未来搜索引擎的接口有了一些了解。随着我们不断深入研究基于情境的搜索,并从日常生活中总结各种模式,互联网充斥着各种新型的信息。接下来,让我们看看搜索领域将发生怎样的变化,以及它将给未来带来怎样的影响。
搜索领域的演进
到目前为止,我们 (作为人类) 一直专注于互联网的普及。当互联网得到广泛的普及时,由于廉价的 ISP(在印度,JIO 让大部分百姓用上了互联网) 和手机 (像 KiaOS 这样的新操作系统,将功能手机变成智能手机),我们向互联网贡献了大量新数据,速度比以往任何时候都更快。
现在,我们更关注于找出现有数据之间的模式和相关性,包括社交数据,这些数据揭示了有关“我是谁”、“谁是我的朋友”等信息。下面是当前搜索领域发展状况的一些要点。
搜索引擎的新世界格局
Schema.org: Bing、Yahoo 和谷歌认识到,为了更好地在新的搜索世界中生存,它们必须把竞争放在一边,并加强合作。2011 年,他们共同发起了 Schema.org 计划。schema 定义了一组可以添加到 Web 页面标记中的 HTML 新术语。它们将被作为页面的意义线索,帮助搜索引擎识别特定的人、事件、属性,等等。例如,如果一个网页包含“五角大楼”这个词,那么将会有一个对应的 schema 定义,用于说明页面内容是关于几何五边形还是国防部总部大楼。
知识图和快照:谷歌一直在扩大知识图谱的应用范围,它在搜索结果页面的右侧为用户提供了一个框,框中提供了符合搜索者意图的图像和信息。Bing 的快照功能与此类似,2013 年推出的“Satori”增强了这一功能,有助于理解人、地点、事件和物体之间的关系。
蜂鸟(Hummingbird):2013 年 9 月,谷歌宣布了它的新搜索算法蜂鸟。谷歌搜索主管 Amit Singhal 表示,蜂鸟是谷歌自 2001 年以来在搜索算法方面做出的最重大的改变。他解释说,在搜索引擎领域,熊猫(Panda)和企鹅(Penguin)是对旧算法的更新,它们的某些方面将继续存在。而蜂鸟实际上是一个全新的搜索引擎,是为满足当今的搜索需求而设计的。蜂鸟极大地增强了对搜索关键词含义的理解。蜂鸟并不是简单地从搜索关键词中提取几个单词,然后试图找到包含这些单词的页面,而是试图破译搜索关键词背后的含义,并提供符合用户意图的结果。Search Insider 博客指出,Bing 和雅虎也做出了类似的改变,尽管可能没有那么明显。他们调整了搜索算法,对完整的短语做出更多的响应,并理解整串单词所的含义。
后起之秀:随着语义搜索的发展,出现了一系列新的搜索引擎。尽管与主流搜索引擎相比,它们的用户数量微不足道,但这些新玩家的优势在于它们能够从头开始,而不必担心修改之前的结构会造成任何影响。自然语言搜索引擎方面的例子有 Powerset(现在为微软所有)、Hakia 和其他一些搜索引擎。
语义搜索的应用
增强现实:在使用谷歌眼镜时,一个(地图的)覆盖层被叠加在用户可以看到的自然景观之上,这将导致出现更多的图像标签和基于视觉的搜索。这与市场营销有着天然的联系,因为购物者可以根据商品的外观来了解商品,并知道在哪里可以购买到。不过,谷歌谷歌仍然面临着一些挑战:它使用了图像、人脸和语音识别技术,这意味着它需要一个连续的网络连接,因为你无法将足够大的处理能力压缩到几盎司重的眼镜中。不过,这一障碍可能很快就会被克服,各种可穿戴技术已经摆在我们的眼前。
搜索和移动:据搜 Search Insider 报道,移动搜索和 Siri 的诞生是促使消费者改变搜索方式的重要催化剂。由于 Siri 鼓励使用自然语言,而且人们已经习惯了能够立即获得他们想要的信息,语音识别技术正在推动搜索引擎的发展。移动搜索工具 Google Now 基于自然语言搜索,会在用户意识到自己想要的信息之前就将这些信息提供给他们。用户对这种响应的期望被带到了基于文本的搜索上,所有主要的搜索引擎都做出了调整,以便满足用户的这种需求。
社交媒体和语义技术:Facebook 宣布,新推出的 Graph Search 使用了语义搜索技术,用户可以更容易地找到他们想要的东西,而广告商可以更直观地了解用户的偏好。Graph Search 还可以让营销目标变得更加精确,因为它可以建立新的联系。例如,用户 (或广告商) 可以找到住在 Y 这个地方并且喜欢 X 的朋友。基本上,新技术为数据挖掘提供了一个宝库,尽管也有一些挑战有待克服。新的更深层次的数据源于人们花更多的时间在 Facebook 上,他们拥有广泛的朋友和联系网络。此外,公众对 Facebook 隐私的担忧仍在继续,这些担忧可能会影响人们“喜欢”某些东西。不过,总体而言,前景是光明的。洛杉矶 Wedbush 证券分析师 Michael Pachter 在彭博商业周刊上预测:“到 2025 年,Graph Search 给 Facebook 带来的收入将占到四分之一,或者是 30 亿到 40 亿美元。”
市场成熟度:经济和社交
正如我们在 Blippar 这样的初创企业中所看到的,在采用新技术时, 市场成熟度扮演着非常重要的角色。Blippar 瞄准了 AR 搜索引擎,但在这家公司还存在的那段时期 (2011 年——2018 年),AR 并没有得到市场的支持 (只是被大肆炒作)。由于其他科技巨头向 AR 投入了大量资金,Blippar 无力抵抗,损失了很多钱。它无法获得足够的收入来维持运营,于 2018 年宣布关门。
接下来让我们看看可以支持文本、语音和 AR 技术的经济和社会成熟度。
经济成熟度
文本
文本搜索的经济成熟度正处于巅峰期。现在所有的搜索引擎都提供了文本接口。
语音
语音搜索的经济成熟度在日益增加。语音机器人研究结果预计,目前美国有 4730 万人(或者说接近五分之一的成年人)拥有智能音箱。这些还只是拥有 Google Home 和 Alexa 等设备的人。此外,大多数新款智能手机现在都配有内置的语音助手。目前我们有 4 个主要的语音助手:Google Assistant(谷歌)、Siri(苹果)、Cortana(微软) 和 Bixby(三星)。因此,大量资金投向了语音助手,保证了语音搜索市场的成熟度。
AR
以下是主要玩家在 AR 方面所做的事情:
谷歌
谷歌在谷歌眼镜上尝试过 AR,但没有成功。
Magik Leap(谷歌拥有部分股份) 在 12 月 18 日发布了新的头戴设备。
微软
Windows 混合现实和 Hololens 于 2016 年发布。
每一台 Windows 10 个人电脑 (自 10 月 17 日以来) 现在都配备了内置的 AR 和 VR 平台。
在这个领域还有很多其他的玩家:
https://www.tomsguide.com/us/best-ar-glasses,review-2804.html
你没有使用上述的任何一种设备,但可能已经使用过某种增强现实技术。此外,谷歌、苹果和微软等公司也在其操作系统中加入了增强现实平台。
因此,与其他两个相比,AR 只是刚刚开始。而且,大多数头戴设备对于普通大众来说都非常昂贵。
社交成熟度
文本
使用过任何一种搜索引擎的人都使用过文本接口。文本接口用起来很舒服。虽然这会花费更多的时间,但是当涉及到多种语言时,它会更加准确。
语音
语音搜索有点炒作过度了。人们一直在说“它将会取代文本”,但统计数据却表明了另外一种情况。在 2017 年和 2018 年,Stone Temple 对大约 1000 名不同性别、年龄、经济状况的人进行了调查。
调查结果揭示了我们通常会在什么时候使用语音命令搜索。
数据表明,大多数人在独处或与认识的人在一起时更喜欢使用语音命令。我们还可以看到,从 2017 年到 2018 年,这种趋势 (不独处时使用语音命令) 正在改善。
下图显示了回答这个问题的人数百分比分布:“当我需要查找信息时,我最有可能……(请对你的前三个选择进行排序)。”
这表明,大多数人仍然更喜欢在浏览器或搜索引擎应用程序中输入搜索关键字 (甚至发短信问朋友),而不是使用语音搜索。
下面是与语音一起使用的应用程序分布。
这证明了我们通常会在使用文本不方便时 (这个时候并不太在意准确性) 或者当我们忙于某些事情 (比如在开车时问路) 时使用语音搜索。这就是为什么在社交媒体上发帖子时使用语音会更少一些,因为在这种情况下,我们需要更高的准确性,否则就会发错帖子。
在社交方面,我们越来越习惯于语音,但它还没有取代文本。但在未来 10 年,随着越来越多的人使用语音搜索,越来越多的应用程序提供语音接口,我们可以预计语音搜索将被广泛采用。
AR
即使这些公司投入了大量资金,但公众并没有做出太多的反应。人们现在还不习惯使用 AR,大多数人只在手机上使用 AR。因此,AR 的唯一渗透是因为它与我们使用的应用程序和服务捆绑在一起,而且其中大多数都是免费的。
在未来几年,随着 AR 设备变得更时髦、更便宜,我们可以地预期 AR 用户将会增长。我们可以预期在十年后,AR 将和今天的语音处于同样的地位。
商业模式
让我们来研究一下搜索引擎的商业模式。
自大众传媒诞生以来,广告已经成为许多企业的一个完美的商业模式组成部分。随着互联网的引入,广告在蓬勃发展,甚至已经吃掉了报纸和电视广告收入的很大一部分。其中一个原因是报纸需要大量的资本才能传播到更大的人口区域,但互联网却没有这样的障碍。
到目前为止,广告在为普通大众提供免费搜索引擎服务方面发挥了巨大的作用。但当我们转向语音搜索时,这种模式似乎并不奏效,正如我们之前讨论的那样,语音的输出效率确实非常有限。在你搜索某个东西时,你肯定不想听到广告内容,对吧?这可能是语音搜索引擎最大的问题。
另一方面,AR 在广告方面有着巨大的潜力,甚至比当前的广告更好,因为我们有更多的情境。此外,当我们在 AR 上展示广告时,它们将比我们今天看到网站上的广告更有效、更吸引人。
还有一个东西,那就是去中心化浪潮,也起到了推波助澜的作用。正如我们所看到的,到目前为止,作为消费者,我们并没有从这些恼人的广告中得到任何好处。但是,在去中心化模型的帮助下,在发布者和消费者之间透明地分配广告收入是可能的。此外,我们可以预期整个广告模式的运作方式将会发生转变。随着人们对隐私和数据挖掘的关注,我们提出了一个模型,在这个模型中,用户的数据仍然保留在用户那里,而广告商 / 发布者仍然可以有针对性地显示广告。
可以在这里了解更多:
https://hackernoon.com/ipfscloud-vision-changing-how-the-internet-works-20289a01af37
结 论
文本在 10 年后仍然存在。
在未来几年,我们将看到很多应用程序支持基于语音的命令,这将是语音搜索的主要驱动力。当你去餐馆的时候,你会看到可以与你发生对话机器人,它能有效地取代大多数服务员。应用程序 /Web 应用程序将有更多基于语音的交互 (仍然会提供一个文本接口来保证准确性),而不仅仅是文本。
聊天机器人 (用于在网站上搜索产品) 将更多地基于语音 (仍然有文本接口)。
AR 设备将会更好、更便宜。它们将达到与现今智能手表相同的状态。时尚将是 AR 眼镜的主要推动力。我们可能会看到 AR 公司和眼镜公司之前发起合作 (这是一个大胆的预测)。
AR 的发展将取决于经济的发展。因为真正的 AR 要求你购买新的设备 (比如谷歌眼镜),而不只是使用现有的设备 (比如移动设备)。但基于 AR 的搜索业务模式将会强大得多。因此,带有麦克风的 AR 搜索接口 (眼镜) 可以解决语音搜索的业务模型问题 (语音可以作为输入,AR 接口可以作为输出,具有更好的广告显示输出带宽)。这些眼镜可以连接到任何设备,可能是你的手机或笔记本电脑。
商业模式的改变。我们看广告可能也能赚到钱。
其他预测
我们将开始看到第一批真正的智慧城市。自动驾驶汽车将成为一种趋势。我们将开始花更多的时间在互联网服务上 (以消磨通勤时间)。
AR 技术可以重新定义旅游业。因为我可以戴上眼镜,不需要任何指导就可以获得所有的信息。但有些人可能仍然更喜欢看旅游指南。
人们将开始理解数据和隐私的价值。
英文原文:
https://medium.com/swlh/how-google-search-will-look-in-10-years-36e4d5e45552