文 | 小羿
Jeff Dean首先登场,他阐述了Google在人工智能领域的愿景,即通过三种途径让每个人都从中受益。这三个方面包括:利用AI使得Google产品更加实用,帮助企业和开发者创新,以及为研究人员提供工具,从而解决人类面对的各项重大挑战。
一、AI已经完全深入Google的软硬件产品
Jeff Dean表示,机器学习是Google在人工智能领域的工作重心。通过机器学习,可以极大的改善Google的产品。这些产品有:将机器学习用于分类的软件Goolge Photos 中的照片搜索(Photo Search)、Google Translate中的即时相机翻译(Word Lens)和 Google Lens。
将机器学习用于预测的系统程序,如Gmail 和 Inbox 中的智能回复(Smart Reply),Google Maps 中停车难易度的图标(Parking difficulty icons)。将机器学习用于理解的系统程序,如Google Assistant,YouTube 中的自动字幕(Auto captions)和神经网络机器翻译(Neural Machine Translation)。
1、Goolge Photos
Goolge Photos是围绕机器视觉建立的一个产品,可以让用户轻松在照片库中搜索到特定照片,比如搜索 “狗”或者“拥抱”的照片。另外,Google Photos还可以自动向用户推荐与哪些好友分享照片。
2、Google Translate
自去年以来,Google开始将神经网络用于翻译中,大大提高了翻译的准确性和质量。据Jeff Dean透露,Google Translate中已经有97个语言对使用了神经网络翻译,整体上使得翻译效果更流畅、更好。而即时相机翻译功能也已经成为Google Translate的一大特色。
值得一提的是,Google Translate是目前在中国大陆唯一能够使用的谷歌产品。
3、Google Lens
Google Lens在今年5月份的Google I/O开发者大会上发布,是一款基于图像识别和OCR技术的人工智能应用,能够让机器学会“看图说话”。Google Lens能实时识别用智能手机相机所拍摄的物品并提供与之相关的内容,目前Google Lens已经集成到Google Assistant和Google Photos中。
4、Gmail 和 Inbox
Google将机器学习用于邮件回复中,推出智能回复的功能,当用户要回复邮件的时候,智能回复可以自动给一些建议的回复内容,可以加速我们的办公效率,尤其是在使用手机回复邮件的时候。Jeff Dean称,目前有12%的邮件回复是在手机上进行的。
5、Google Maps
通过机器学习,Google Maps可以变成一个实用的地图,比如目前的停车难问题,Google Maps可以预测这个地方有没有停车位,标出停车难易度的图标,然后帮你导航过去。
另外,通过机器学习,基于你愿意看什么节目,愿意听什么音乐,它还可以帮助用户推荐一些歌曲或一系列相关的音乐产品,这就能运用到Google Play Music上。
6、Google Allo
Google Allo是一款主打定制表情的即时通信类App,使用者在发送这些表情或文字的时候,可以改变进行涂鸦表情回复,以此来表示预期和心情。另外,人工智能甚至在Allo上可以帮助你聊天,人工智能能自动推送你一些常用的回答方式。
7、Google Assistant
Google Assistant核心技术是语音识别。比如询问Google新德里的天气是什么样的,它会通过语音识别、理解,然后以合理的形式展示给用户。Jeff Dean说,这个系统是非常复杂的,其中包含了很多机器学习的相关技术。这个产品没有机器学习是不存在的。
8、YouTube
在YouTube上,通过机器学习给超过10亿的视频自动加上字幕,可以让世界上近3亿的聋哑人或者有听觉障碍的人可以看到视频上的东西。Jeff Dean成,我们还在不断的改进这个语音识别系统,使“自动字幕”的文字准确性提升了50%。“通过神经网络等技术,可以让听力有障碍或者不精通视频播放语言的人通过自动字幕享受到视频。”
9、Pixel Buds
Google将AI与新型硬件、软件相结合的另一个实例是 Pixel Buds。这是一种能实时将你周围别人说的话翻译成你的母语的耳机,运用了语音识别和翻译技术。Jeff Dean表示,有了它你就能在陌生的语言环境中漫游,几秒钟后便能翻译成你的母语。
Jeff Dean同时提到,在2017年5月,我们发布了TensorFlow1.0,同时我们也在不断的进一步发开增加新的功能,让这个平台变得更好用,更强大。
二、人工智能对于硬件产品使用体验的提升
Google Pixel Camera产品经理Isaac Reynolds详细阐述了人工智能对于硬件产品的体验提升。
首先,他介绍了Pixel 2 XL上的人像模式(Portrait Mode)。Isaac Reynolds到达东京的以后,他用Pixel 2 XL拍摄了很多人像照片,通过机器学习技术,可以自动判别哪个是人,哪些物体距离更近,哪些更远,从而自动进行背景虚化,达成更好的人像效果。Isaac Reynolds说,虽然手机硬件的创新看上去是结束了,但还有很多AI与软件方面的创新。
机器学习还被用于为Google Home智能音箱提供语音配对功能(Voice Match)。机器学习有助于识别不同的语音,使最多六个用户连接到同一台 Google Home。Isaac Reynolds称,Google Home是首个具备此功能的智能音箱。另外,机器学习技术也帮助Google Home仅适用两个麦克风就能判断声源位置。
另外,基于地理位置,机器学习可以帮助Google Home Max判别音箱所在的位置,自动调节适合录音室还是家中的音响效果。
三、用机器学习解决语言问题
Google研究项目总监Linne Ha详细阐述了机器学习如何帮助解决语言问题。她说,世界上有6000种语言,另外还有很多方言,这其中超过100万人以上使用的语言有400种,但是,目前网络上的内容大约50%以上都是英文,这就是用机器学习来解决语言互通的重要性。
Linne Ha称,语言是身份不可或缺的一部分,谷歌想要创造一个技术,能够让更多的人联网,让不同语言的人上网更容易。
另外,机器学习技术在输入法也是非常重要的。首先是键盘,英文有26个字母,这个键盘排列很普遍,但是有一些语言有30个字幕,我们通过机器学习来做预测排列方式。
其次是谷歌手写输入,Google Handwriting Input,利用机器学习可以更准确的判断手写内容。
第三还有语音输入Voice Input,在机器学习的帮助下,自然语言处理系统能够更好地理解你想说的话。语音搜索支持 119 种语言,其中包括 11 种印度语言和 3 种印度尼西亚语言。
对于小数据的语言模型的训练,Linne Ha说到,他们还发起了Unison Date Collection活动,到小语种地区,让当地的人每人说45分钟,收集数据进行训练。
另外,Google 还发起了文本转语音 (Text-to-Speech)项目Project Unison,这是一个利用机器学习实现文本向语音转换的实验项目。通过转换引擎,手机可以用语料并不丰富的语种,如孟加拉语,高棉语和爪哇语与您对话。而机器学习模型有助于减少构建文本到语音模型所需的数据量。
Linne Ha称,方言是我们的下一步需要解决的问题。
四、打造新的人机交互方式:Google Assistant
Google Assistant 工程总监Pravir Gupta介绍了这款智能助手的情况。他说,目前的 Google Assistant支持不同种类的任务,比如寻找某一问题的答案、导航服务、获取新闻或得到日程安排方面的帮助,在现场,Pravir Gupta为了一个“在东京是不是要给小费”、“给我XXX的照片”、”中巴犬是怎么叫的“等问题,Google Assistant简洁完整的回答了这个问题。最值得一提的是, Google Assistant 可以在不同设备间通用,并且可以无缝切换。
目前,Google Assistant可以在澳大利亚、巴西、加拿大(英文和法文)、德国、法国、意大利、印度(英文和印度文)、印度尼西亚、日本、韩国、墨西哥、新加坡、西班牙、英国、美国等国家和地区使用。
五、机器学习在企业中的应用
Google AI在企业领域的布局逐步清晰,Google为企业及开发者提供三种创新工具:TensorFlow,云机器学习 API (Cloud Machine Learning APIs) 以及张量处理器 (Tensor Processing Unit, TPU) 电脑芯片。主要目的是为了帮助企业进行创新,同时优化流程。
会上,Google邀请了日本当地食品企业丘比(Kewpie)公司上台演讲,阐述了丘比公司使用AI改善日本管理思想中的现场管理,包括顾客管理、供应链等方面。丘比使用 TensorFlow 开发出一个工具,可以从婴儿食品中所使用的切块土豆中检测出食品生产中有缺陷的成分。
六、利用AI解决人类面临的巨大挑战
会议最后,Google产品经理、医疗成像团队负责人Lily Peng登台演讲,阐述了Google的AI技术如何帮助人类解决目前面临的一些重大挑战:如医疗保健、能源和环境保护问题。
在医疗方面,Lily Peng 的团队与印度、泰国和美国的一些医院合作开发一种工具,可以通过机器学习帮助诊断糖尿病所引起的视网膜病变(数据显示,全世界有4.15亿人收到此病的困扰,50%的患者因为得不到提前检查致盲。)的筛查工作。他们所开发的算法的准确性可以媲美专业的眼科医生,能够在缺少眼科医生的地方发挥重要作用。
Lily Peng回顾了他们对深度神经网络进行了培训的过程,她的团队获得了众多的糖尿病指视网膜病变的图像,一共收集了13万张这种图片,然后找了54个专业医生进行阅读,进行了88万个诊断,对图像进行分级和模型训练。最终的这个系统的结果,机器学习系统的表现比专业眼科医生的识别准确率还要高一点。
另外,机器学习还用乳腺癌的诊断,通过将机器学习应用于乳腺X光检查,来探索新的方法以提高乳腺癌的检测几率。Google、DeepMind联合英国癌症研究中心研发,希望建立一种机器学习模型,能够快速、准确地检测出癌症的迹象,帮助医生尽早发现癌症,以便尽早开始治疗。
机器学习运用到医疗领域之外,还可以推进很多的进展,还可以找到新的治疗方法,用到基因测序,计算机环保、能源、交通领域的问题,Lily Peng说,我们还是处在一个开端,我们希望这些方法能为研究机构提供更多的方法。
在环保问题上,Google邀请维多利亚大学博士生Victor Anton阐述了如何利用机器学习来保护鸟类。Victor Anton 致力于追踪新西兰濒临灭绝的鸟类,以改善对它们的保护工作。他收集了 5 万个小时的音频并将其转换成谱图,通过 TensorFlow 更加快速高效地分析这些音频,对鸟类的声音进行分类,识别谱图中的鸟鸣声,以便更好的了解鸟类。他希望此研究能够为新西兰未来的动物保护工作提供有价值的信息。
七、总结,Google是一家AI First的公司
Jeff Dean在会议最后总结到,作为一家 AI First 的公司,Google 致力于让每个人都能够从人工智能中获益。Jeff Dean称,虽然取得了一些成绩,但是还有很多困难需要克服。
例如需要想方设法让机器学习模型的创作过程更加触手可及?为了解决这个问题,Google已经开展了人工智能的内部培训,已经有1.8万名Google员工参加过此项培训,而且Google将于2018年在互联网上提供免费的机器学习课程。Jeff Dean同时透露,Google也同时在中国招募机器学习相关的人才。
另外一个挑战是,如何确保我们构建的机器学习模型具有包容性,并且能够真正为每个人所用?Jeff Dean说,Google已经启动了People + AI Research (PAIR) 计划,这个计划旨在将 Google 的研究人员聚集在一起,研究并重新设计人与人工智能系统交互的方式。Facets 正是此计划所孕育出的一种工具,能够 将用于机器学习的训练数据可视化。
除此之外,Google还与Geena Davis 研究所合作建立了GD-IQ,可以利用机器学习检测电影中性别偏见的工具。