微信公众号“AI 前线”,(ID:ai-front)
作者 TOM SIMONITE
译者 & 编辑 | Debra
Facebook 陷入水深火热之中。假新闻、恐怖主义、操纵俄罗斯大选,也许之后就是受管制了。这家公司把求救之手转向 AI。而这个策略将要求 Facebook 突破计算上的几大挑战。
在上个月的两次国会会议上,首席执行官马克扎克伯格在解释公司如何改善其平台监管时引用了 AI 一词超过 30 次。负责履行这些承诺的人——首席技术官 Mike Schroepfer 在 Facebook 年度开发者大会上的主题演讲和采访中也提到了这个主题。
Schroepfer 告诉成千上万的开发者和记者,”人工智能是我们维持社区安全的最佳工具。“在听证会之后,批评人士指责扎克伯格把人工智能推出来误导人们,公司的问题仅仅是技术问题。Schroepfer 承认 Facebook 犯了错误。但他表示,对于月用户达 20 亿的 Facebook 而言,人工智能是解决这些问题的唯一方法。
即使公司可以负担得起雇佣人类检查每一篇文章,但这不是公司想要的解决办法。Schroepfer 说道:“如果我告诉你,你所有的文章在发布之前都有人读过,也许你会改变要发布的内容。”
Facebook 已经使用自动化技术来监控其平台,并取得了不错的效果。例如,自 2011 年以来,该公司已经使用了一种名为 PhotoDNA 的工具,该工具最初由微软开发,用于检测儿童色情内容。Schroepfer 表示,该公司的算法在不断改善,足以标记出不想让其在平台上出现的图像。
首先是裸露和色情图片,Schroepfer 将其描述为“光谱更容易识别的一部分”。接下来是描述“血腥和图像暴力”的照片和视频,如 Isis 斩首视频,这些图像很难从像素级别与正常图像区分开来。我们现在对这些图像的处理效率更高,”Schroepfer 说道。
但困难仍然存在。Schroepfer 表示,Facebook 近几个月来一直在投入资金解决选举信息真实性、虚假广告和虚假新闻等问题。“公平地说,在过去的几个月里,我们已经将公司的所有资源聚焦到了这些问题上,”他说道。扎克伯格本周早些时候表示,他预计将花三年时间建立更好的系统来捕捉不合理的内容。
此外,Facebook 的 AI 安全网计划还面临着机器阅读的问题,而不是视觉。那些用来打击因为 2016 年俄罗斯大选被推上风头浪尖的假新闻、骚扰等问题的软件需要了解人们在说什么。
尽管 Facebook 的网络搜索和自动翻译很成功,软件仍然无法了解语言的细微差别和语境。在周三的主题演讲中,Facebook 的机器学习和人工智能总监 Srinivas Narayanan 用“Look at that pig!(看那只猪!)”这个语句来解释这个挑战的难度何在。这句话出现在一只宠物猪的评论中可能会很受欢迎,但在用来评论一张婚礼照片可就不好了。
Facebook 公布了一些读取算法的进展。该公司周三表示,自去年年底一个可以发现人们伤害自己迹象的系统部署以来,已经有 1000 多人拨打了急救电话。语言算法帮助 Facebook 在今年第一季度删除了近 200 万条与恐怖分子有关的内容。
Schroepfer 表示,Facebook 还通过训练软件生成虚假数据来改善欺凌检测系统。经过对抗训练,侮辱性语言识别和拦截的效率越来越高。这使 Facebook 成为使用合成或伪造数据来训练机器学习系统的众多公司之一。
Facebook 面临的另一个障碍:其他语言。Facebook 的语言技术在英语中效果最好,这不仅是因为 Facebook 是一家美国公司,还因为该技术通常使用从英特网占主导地位的互联网上获取的文本进行训练。Facebook 数据显示,该平台超过一半的用户不会说英语。“这是一个巨大的问题,”Schroepfer 说道。
Facebook 在世界某些地区占主导地位,因此语言成为一个至关重要的问题。Facebook 承认,缺乏缅语内容审核人员,是没有避免这场危机的原因之一。
Facebook 正在开发一个名为 MUSE 的项目,有望以不同的语言开发同一种语言技术,而不需要大量新的训练数据。在这个方法实施之前,Facebook 通过手机新数据加速系统的方法将 AI 系统扩展到新的语言。
在某些情况或地点,数据传输很慢。暴露出一个问题,即 Facebook 没有选择在所有地方建立相同的语言资源。执行官 Tessa Lyons-Laing 在周二举行的 Facebook 会议上宣布遏制虚假消息传播时说道,机器学习软件正在学习标记经过 等组织手动标记过的虚假内容,但该技术只有在 Facebook 与当地的事实核查小组建立联系,并且已经建立好数据收集情况下才会起作用。
Schroepfer 表示,找到一种不必依靠人力投入就能完成工作的方法是他推进人工智能的主要策略之一。周三,Facebook 的研究人员展示了用数十亿个 Instagram 主题标签作为免费的数据源来进行图像识别的方法,并创造了新纪录。Facebook 面临的很多最棘手的问题,都无法将人为判断排除在外。 Schroepfer 说道:“当决定事物好坏的时候,人工智能并不能替代人类。” “当人类做出决定后,人工智能是一个很好的执行规则的工具。”
原文链接:
https://www.wired.com/story/how-artificial-intelligence-canand-cantfix-facebook/