公众号/机器之能
编译 | Rik R、王宇欣、王艺
来源 | Curbed
作者 | Patrick Sisson
1969 年,著名作家 William H. (Holly) Whyte 和同伴一道展开了一项关于纽约市民生活的调查。他们受雇于城市规划委员会,在这个喧闹的城市中安装摄像机,以暗中追踪市民的活动。最后,Whyte 对他们得到的影像素材进行分析,并成功揭秘了一些不为人知的事实。
Whyte 和他的团队花了无数个下午来拍摄公园、广场、人行道,又花了更多的时间去计数、删改、分析和量化镜头片段。他们对人们的见面和握手方式进行了标注,将行人的运动路径绘制在图纸上。
为了对一个街道拐角处的行人活动进行准确评估,Whyte 的研究队员对等待红绿灯的行人进行了手动筛选。可以想象,这份工作有多么耗时,仅圣巴塞洛缪教堂的花园在午餐时间的平均人流密度就能达到每千平方英尺(约 93 平方米)12-14 人。
如果你观察一个城市的街头、人行道、或广场足够长的时间,你就会发现城市的是多么无序而充满能量的存在。纽约市民对 Whyte 的工作表现出了极大的欢迎和好奇,把它当成了一个娱乐活动。
「Whyte 除了发现人们闲谈的地点之外,就只发现了人们喜欢他的工作。」一篇 1974 年发表的纽约时报文章冷冷地说道。
但事实上,Whyte 的街头生活项目具有强大的启示意义。Whyte 提供的不是金块,而是可操作的数据块——高峰与非高峰时间段的活动、平均密度、行人流动路径等,这些数据块有助于帮助制定城市政策。
Whyte 被誉为「美国最具影响的城市观察者之一」,他来之不易的结论及对城市独到的见解影响了 1969 年的纽约城市规划,帮助其修改了纽约分区代码,且将过去脏乱差的布莱恩公园变成了一个受人喜爱的公共空间。
直到最近,城市规划者还在实践 Whyte 的做法,进行耗时的人工观测。这肯定令 Whyte 非常欣慰,但又实在让人难以置信。毕竟,红外摄像机及相关技术已经存在多年,这些技术在理论上能够有效加快数据采集过程。但实际操作过程中,对于调查、个体观察和理性猜测等任务,这些技术往往还不能胜任,还需要手动计数和影像研究。
当下,智能手机变得越来越易于携带,且地方领导对智能城市技术的接受度也越来越高,我们似乎正被大量的城市数据淹没。但这些只是毛毛细雨,行将到来的计算机视觉和机器学习技术,可能会彻底改变我们对城市及其功能的理解。这两项迅速崛起的技术或将革新人们对城市生活的认知。
「能够在无人干预的情况下将图像转为数据,是一种超级强大的能力。」谷歌城市技术子公司 Sidewalk Labs 的首席策略官 Rohit Aggarwala 说道,该公司正在多伦多建立它自己的智能社区。
由于摄像机的价格从未像今天这样便宜,突然之间,几乎每个城市都能够将 Whyte 的工作方法复制到自己身上。运用计算机视觉技术将图像转为数据,运用机器学习针对数据进行模式识别,然后对城市进行预测和规划。
技术进步之势似乎无法阻挡。仅 2016 年一年,计算机视觉公司所获得的风险投资就达到了五亿美元,机器学习领域的全球投资额估计在 48-72 亿美元之间。纽约大学的数据城市项目预计,到 2030 年初,城市科学与信息领域的市场规模将达到 25 亿美元。
今年年初,在拉斯维加斯举行的 CES 消费电子展上,供应商们对自称为「智能城市」技术公司的喜爱远超游戏或无人机公司。随着电子时代下的年轻一代的城市规划者开始上任,市面上开始出现自动化产品和自动驾驶汽车,改善市政技术的迫切性和紧迫感从未如此之大。
除了摄像机的普及外,眼动跟踪技术也已被广泛应用于零售场景,加上智能手机数据处理能力的提高,突然之间,城市空间的意义发生了变化。现在的城市空间是实时的,甚至是可交互的,曾经科幻小说中的内容正在变成现实。
「城市规划者在对『人』相关的问题进行决策时,可以使用这些数据。」塔夫斯大学教授 Justin Hollander 说道,他是 Urban Attitudes Lab 的 CEO,该公司试图探索出设计与技术的交叉点。
与此同时,由以 Jan Gehl 为代表的城市规划师所首创的「以人为中心」的设计,将进入一个新的阶段。它将威胁到传统的模拟设计方法,运用更加科学的方法来进行规划。
「当我还是一名城市规划师时,为了塑造建筑、街道和人行道,我们会使出所有力气。这些城市规划需要符合环保和经济发展的目标,」Hollander 说道,「但我们从来没有仔细思考过空间使用者的诉求。」
要理解计算机视觉和机器学习的潜力,就去购物中心看一看吧。线上市场营销人员已经从消费者的在线数据和购买习惯中获益颇丰,现在他们还希望将这些新技术应用于线下商店中,连通消费者的线上线下行为,拓展生财之道。
据全球设计和建筑咨询有限公司 CallisonRTKL 副总裁 Joan Insel 的说法,零售商出于保护消费者信息安全的需要,一直在对其数据进行跟踪。同时,由于计算机视觉、面部识别和机器学习技术的提高,数据挖掘和数据分析的维度也开始多了起来。
她说,许多公司正在大量投资新技术——沃尔玛的「开普勒」无人超市项目中的人脸识别系统已申请专利,该系统可以追踪消费者的情绪,并在察觉到有顾客情绪不佳时通知店员进行协助。但由于隐私问题,沃尔玛不太愿意讨论这一系统。
「在如今的零售业中,市场细分已不再是被广泛探讨的问题,个体客户需求的解读成为行业热点。」她说道,「每个人都想弄明白其中的秘诀。」
Standard Cognition 是一家总部位于三藩市的机器视觉初创公司,该公司对于消费者洞察有一些独特的见解。在一系列摄像头的支持下,该公司的自动结帐系统能够实现无人零售/自动结账。
由于业界对于无人零售的关注越来越多,该公司已经得到全球几十家顶级零售品牌的订单,并筹集了数百万美金的风险投资,这一切都是因为他们在数据分析层面的独特方式。
「你可以把我们的系统想象成,用一张图像描述店里发生的一切。」联合创始人 Michael Suswal 说道。
Standard Cognition 系统的功能独一无二。它可以接近完美地进行存货清点,不会发生半点差错。在售货员将零散物品摆放回货架的过程中,该系统还能够设计最优路线,节省售货员的体力和时间。
更重要的是,这项技术可以跟踪人们的意图和活动:比如人们拿起又放下,最终没有放入购物车的东西是什么,甚至能够对他们在商店里目之所及的所有东西进行跟踪。
Standard Cognition 可以通过不同的摄像机机位,同时从多个角度对购物者进行实时跟踪。(NBA 采用了一个类似的系统来跟踪球员,Suswal 说道,但其技术或许会容易些,因为能够参考球员身上的球衣号码。)
该公司计划在 2018 年初开放一个线下演示点,在那里用五花八门的商品训练机器学习系统识别不同的商品以及行为的能力。
当下,Standard Cognition 正跻身于无人商店的投资浪潮中,同处这一浪潮中的公司还有计划开设数百家无人便利店的京东。
Suswal 说,Standard Cognition 的下一个着眼点是安全问题。既然系统能够被训练出识别蔬菜和水果的能力,它就也能够识别出钱包和枪支。Suswal 说,这一过程就像教育孩子一样,需要防止他们学坏。
像小孩子一样,许多隐私专家担心这项技术会无意中学习到偏见。据乔治敦法律隐私与技术中心在 2016 年 10 月出具的一份报告 The Perpetual Line-Up 显示,国家执法网络的面部识别系统获取了二分之一的美国成年人照片,该系统对妇女、儿童和非裔美国人的识别率最低,但该系统恰好最有可能被应用于这些群体中。
在未来,这些技术将让你无处可藏。「它将随着机器学习的优化而变得更加便宜,」Suswal 说,「它将无处不在,你的所到之处都会有一个计算机在看着你。但实际上,你的隐私正在变得更加安全,因为只有机器在看你。」
更进一步,意图分析可以用来重塑人类的生存、居住、工作环境。
联合办公巨头 WeWork 在全球设有 200 多个办公地点,该公司利用视频分析、机器学习技术及许多其它数据源,包括热力图和该公司的 app,来设计更好的工作环境。Daniel Davis 是该公司研发团队的首席研究员,他认为这项技术创造了一个无穷无尽的反馈循环。
「建筑业过去总是依赖于人类的直觉以及资深人士的经验。」他说道,「而如今,我们对设计方案的测试和评估理念已经改变。无论是交通规划设计、车辆计数还是会议室的使用规划,我们都能够利用很多在过去不明显甚至根本无法获得的信息进行分析。」
相比于传统的建筑公司,WeWork 的业务模式更偏重垂直整合,即对空间进行重塑设计、改造以及运营。这也是为什么他们比传统的建筑公司更用力地拥抱新技术。
作为空间所有者,他们可以针对数据的表现作出反应、优化状态不佳的区域,这对于其他建筑设计方来说,可谓是一种奢侈。它们还可以预测用户需求:通过机器学习算法来输入数据,他们可以在一个特定的会议室建成之前预测其使用率。
先捕获意图,然后在设计与建造之间建立一种循环关系——分析、设计、评估,然后再设计。按照这样的模式,这种技术可以产生更多的以人为中心的设计和城市规划。
Davis 说,从历史上看,计算设计是指 Frank Gehry 和扎哈·哈迪德等设计师的扭曲、充满疯狂的创造性的建筑,这应部分归功于强大的计算机处理能力。在未来,计算设计将涉及更人性化的层面。
「如果你走进 WeWork 的空间,不会觉得来到了一个很高科技的地方。相反,它看起来亲切、友好而热情,」Davis 说道,「它看起来并不复杂,这个空间是以你所需要的方式在运转,没有数字化的身份感。」
城市规划表面上似乎与 Davis 团队的目标一致:你怎么才能把共享空间做的更好?就像 Sidewalk 实验室的 Aggarwala 所说,所有的设计都是为了改善大部分没有被数字化的服务。
随着 Aggarwala 的公司开始扩展自己的业务,规划并最终设计出在多伦多的智慧城市项目,付出巨大努力做成的「互联网+」小区也就成形了。
他说,在建设这样的小区的过程中,最主要的考量因素是为行人设计一个自然的空间,过马路的时候应该要让人们有安全的感觉。
比如,嵌入 LED 灯的路面可能根据不同的需要变换颜色,为来往的人们提供一些小线索让他们知道什么时候该走,什么时候该停。
动态寻路和指示牌在清晨会直接指向咖啡店,而在傍晚则会自动切换,重点突出周围的餐厅和酒吧。
交叉路口自适应的交通信号将会识别出行人、自行车和过往的车辆,从而提升安全性。自动驾驶接驳车负责在小区接送居民到家。
Aggarwala 想要设计富有互动感、能够理解行人意图的街道,这样人们就不会一个劲低头玩手机了。
他表示,「我们不希望做出一个科技感的社区,而是想要设计一个真正的邻里社区,科技需要落到实处。」
他说,尽管 WeWork 和其他公共领域管理者之间有很大的不同,但是 WeWork 所追随的可用性原则仍然适用于广大的城市规划领域。即便公园等场所的管理方没有研究部门,但他们仍能够利用 WeWork 提供的新工具收集信息,并用在其规划设计中。
他以一个社区公园为例。由于周边地区人口统计数据的变化,尤其是 2-3 岁的幼儿和十几岁的青少年数量的增加,社区需要被重新设计以增加更多儿童游乐场所,例如建造更多的滑板场地和篮球场。这个社区公园的便利设施不应该在几十年前的设计上进行翻新,而是应该随着社区的发展自我迭代。
虽然这不是什么革命性的技术。但是如果城市的设计能够随着城市的使用以及人口数据同时发生变化,那么也就意味着城市规划、政策和预算将发生转变。
由麻省理工学院、哈佛大学和国家经济研究局的研究员组成的团队发布了一份研究,他们使用几年间的谷歌街景地图作为训练素材,试图利用机器学习技术找出执政规划的改变与社区安全之间的联系(包括人口密度、接受过大学教育的成年人占比、以及西班牙裔居民的比例等衡量因素)。团队认为,将他们得出的结论进行反向操作,管理者就能在社会问题出现之前适时调整城市设计以期防患未然。
「现在,我们终于可以根据实际数据调整资本计划和预算了,」他说道,「你手中握有数据,那么你就可以在争论中胜出。在以前,人们只会模仿过去的行事方式,因为这样最安全,也没有人会为了这样循规蹈矩的设计攻击你,现在就不一样了。」
把这些技术扩展到整个城市的层面,要是想用摄像机和传感器覆盖整个社区(Aggarwala 等人称其为「数字层 Digital Layer」),则需要大量的基础设施的支出和带宽成本。
多伦多在这一方面具有优势,因为 Sidewalk 实验室正在此发展并收集数据。但与此同时,公众对于私人公司收集民众信息这件事还是抱有隐私方面的担忧。总部位于布鲁克林的初创公司 Numina 希望能将类似技术的门槛降低,同时让数据采集更容易被公众接受。
Numina 最近推出了自己的监控摄像头,这些摄像头被装在一个 PVC 塑料管里,看起来就像是饮水机旁方便人们取用纸杯的塑料管一样。
这些管子能够被非常方便地安装在电线杆或者道路指示牌上,成本低廉。在国际智慧城市世界大会上,该方案被评为最具前景的 5 大技术之一,已经成功地在美国的 4 个城市进行了安装,另外还有 3 个地区正处于规划阶段。
出于个人经历原因,联合创始人之一 Tara Pham 创办了这家公司。2013 年,她与她的联合创始人在骑自行车的时候被车辆撞倒,她们痛下决心要为自行车和行人建造一个更好的环境,让城市根据数据做出决策。
在她们刚刚创业的时候,为了获得真实的交通数据,城市规划人员还停留在在白板上写写画画,用计算器演算的阶段。4 年之后,她们公司发布了一款多用途、易安装、太阳能供电的公共领域测量工具,这款工具的推出在无需人工监视的情况下为城市提供了可行的智能解决方案。
相机每秒拍摄 3 次,图像在设备上进行处理,仅传输有关物体类别的匿名数据,比如自行车或是行人之类,而不是存储并共享清晰可见的人脸照片。
该系统可以追踪街道的使用情况;设定新的安全指标,比如现在差点发生的事故也能够被记数;甚至有可能会触发城市服务的调整,比如垃圾回收就是一个在今年春天进行试测试调整的城市服务。
Pham 说,「我们从 18 个月前开始了我们的业务,这期间内机器学习和计算机视觉已经变得相当大众化了。在传感器中构建图像处理功能比以往任何时候都便宜得多。」
虽然 Numina 刚刚创立不久,但是它已经帮助城市启动了数据设计反馈的循环。在美国佛罗里达州的杰克威尔逊市,也是行人死亡率最高的城市之一,Numina 的传感器设置在了十几个十字路口。
在靠近一个公共汽车站的站点,经过不间断的监控发现,在周围乘客上下车的过程中,行人总是不断地乱穿马路。曾经,城市管理者认为自己需要重新设计整个路口。然而数据显示,最快、最有效的解决方法是在马路中间建立一个隔离栏,仅需 30 美元。
如今在街道上安装的新的「眼睛」不会对我们的城市景象造成多么大的改变,但却会使城市运转更高效、城市使用率更高,最终受益的还是人类。
建筑师兼研究员 Ann Sussman 花费了数年的时间使用眼动跟踪系统来了解人们对不同建筑和城市设计的反应。她认为,技术可以理解人的意图,甚至捕捉潜意识的欲望也不在话下,这样的技术将会催生设计领域的「生物学时代」。
「我在建筑学院上学的时候,没人提到过什么认知科学,」她说,「今天,我可以测量人们对建筑设计的即时反应,并在修改建筑外观的同时观察到他们激素分泌的变化。」
Sussman 一直致力于研究人类在潜意识下如何对建筑作出反应。通过照片比较、追踪微小的面部反应,她能更好地了解哪种设计能更让人们开心:活跃的、易于开窗的设计更能讨人们欢心,就像在巴黎和波士顿的建筑一样。
像阿姆斯特丹运河沿岸那样的对称性建筑能够让人们平静,而像留有大片空白外墙的波士顿市政厅等一些野兽派风格的建筑,则会令人困惑,因为在人们走进去之前,建筑物的外观并不能为他们提供更多的信息。
与 Sussman 合作的 Hollander 进一步进行了这方面的实验和调查,他测试了某些地区及其社区内人们的健康和生活质量。
2016 年,纽约想要了解一些特定的设计模式是如何影响社区健康的,他们聘请 Hollander 来查看城市周围十几个不同的公共建筑,包括博物馆、图书馆和社区卫生中心等。
使用了一系列包括脑电图(EEG)在内的生物特征测量大脑的活动和面部分析,Hollander 追踪了某些改进和翻新是否会影响人们对建筑物的感觉。
纽约还没有对外公布它将如何根据 Hollander 的发现进行整修,但是 Hollander 认为这种分析为公共决策添加了另一个信息层,只是直到最近这个信息层还未可用。
Sussman 和 Hollander 的研究提出了一个更具交互性的城市的可能。城市可以对我们的行为和意图作出回应,并被重新设计。那么,它可以对我们潜意识作出回应吗?也许有可能。
正如麻省理工学院教授 Carlo Ratti 所建议的那样,我们可以使用这种分析技术来建立适应人类需求的建筑,而不是反过来让人类适应建筑。
「除了我们天生带有的一层皮肤和身上所穿着的衣服之外,建筑通常被称为『第三皮肤』。」他说道,「但是,在很长一段时间里,它更像是一件旧时女性所穿的紧身束胸:我们身体之外的一个坚固、强硬的附加物。我认为这种新型的数字化技术和分布式智能有潜力改变这一现状。」
智慧城市的基础已经奠定好了。除了像 Sidewalk 实验室、松下等对试验社区进行投资的科技公司之外,美国的大型电信公司 Comcase 和 Verizon 等,也在投资建立新的大型物联网网络,这将使设备连接更普遍,在全市范围内的部署也将更便宜。
这种技术的力量,以及在城市当中迅速的应用已经让民权团体对它能够颠覆隐私、安全甚至是政府监视的能力有了警惕。上个月,乔治敦隐私和技术法律中心发现机场正在使用视频和机器学习系统。越来越多的执法机构计划升级并采用这项技术。
Ekin 是一家出售配有面部识别技术巡逻车的国际公司,「我们计划在 2015 年把公司的经营范围扩大到美国。」公司发言人表示。
Ekin 的产品在 1 月 8 号开始发售,为美国的执法部门提供了一整套产品,包括 Ekin Face,一种面部检测和分析的系统,能够确保发现可疑人员、罪犯或是通缉在逃人员,有时候人眼都不能观察到这些人,该系统还能及时的采取适当的行动。」
智慧城市技术的支持者同样认可我们不能为了数据而牺牲隐私和匿名权。Sidewalk 实验室的 Aggarwala 表示(他为谷歌母公司 Alphabet 旗下的一家公司工作),有时,投放一些有针对性的广告会起作用,表明这些系统绝对不可能被设计成获取大量数据的工具或是被用于非法调查。在最近的 Reddit AMA 中,Sidewalk 实验室负责人 Dan Doctoroff 说:「隐私应该成为我们开发这些工具的基础。」
Aggawwala 认为,现在正在开发的系统实际要比 William H. Whyte 的视频工程有更强的隐私保护的潜力:它们进行分析所需要的仅仅是一些信息点,能在不侵害任何人身份的情况下被提取出来。有了这些信息,规划师和设计师能够创建与其它地方别无二致,但是更好的城市,最重要的是不会侵犯任何人的隐私。
随着物理的世界变得更加数字化,我们发现自己在过马路时就像是在浏览网页一样:在隐私和便利之间,或者说在个性化与监视之间最佳的平衡是什么?
Aggarwala 说,「真正令人害怕的在于这种技术很全面。」
这是一个与上帝视角有关的问题。对于 William Whyte 所采用的方法来说,最终都需要有一个记下全部事情的旁观者。但新型的技术不仅仅是一个观察者,而是一个博闻广识的叙述者。
「想一想蚂蚁。」Standard Cognition 的 Suswal 说,「从人类的角度来看,我们可以仔细观察一个蚂蚁部族,然后预测将要发生的事情。但是蚂蚁,他们只是在彼此身边爬行罢了。现在,我们就是蚂蚁。这些具有预测分析功能的相机将使我们看到更加不同的东西。」