公众号/
来源:NVIDIA DEVELOPER等
编译:T.R
想象一下你可以默默不语地说话,也可以不动声色地和和你的智能设备交流,这是一种怎样的神奇体验呢?
来自MIT媒体实验的研究人员们日前研究出了一款可以通过头部肌电信号来获取心中默念内容的可穿戴设备,使得人们可以在别人毫无察觉的情况下与自己的智能设备交流,同时也有望成为人与人之间崭新的沟通手段。
这一可穿戴设备主要的通过电极收集面部和颌部的肌电信号,并通过深度神经网络训练模型判断出与信号关联的特定词汇。由于这一设备是直接获取人在默读时的肌肉信号的,用户可以再肉眼毫无察觉的情形下与设备沟通,而无需夸张的喊出”Hey,my device”。
同时它还配备了骨传导耳机与用户进行交互,不会打扰到正常的沟通和听觉体验。这种新型设备属于IA(intelligence-augmentation智能增强)设备的一种,可以极大地延伸人类的认知能力。研究人员发明的初衷在于平日手机或移动设备使用的不便。我们的生活已经离不开移动设备了,但与设备的交互方式却依旧显得那么突兀。
回想一下平常需要接入网络或者借助手机工作的时候,总是需要拿出手机找到应用、并通过键盘输入冗长的指令和信息。这一过程打断了我们原先在进行的任务,转移了正在集中的注意力。是否又一种新的交互方式可以再不影响当前状态前提下,享受与设备进行的自然交互。
于是研究人员们提出了这种称为AlterEgo的可穿戴设备,致力于为用户提供更为便捷的自然的交互方式。
在信息时代里沟通和交互变得十分重要,AlterEgo的目标在于为人与机器、网络、设备甚至人与人之间提供一种不动声色但高效的自然语言交互方式,使得计算设备能够更有效的嵌入到人类的自我意识中,协助人类更为有效的工作、更加便捷美好的生活。
科学家根据人在默读时面部下颌会有相应微弱的肌电信号产生,便希望收集肌肉信号来得出心中默念的特殊词汇。
科学家们利用非侵入式的电极收集肌电信号,通过共有八个电极。他们可以在用户不张嘴做出肉眼可觉察变化的情况下收集一系列肌电信号,并将这些信号传输到设备的深度学习模型中进行识别。
图中是第一代原型设备,为了让它更为美观设备便逐渐演化成了文章开始处单边电极的外形。
科学家们收集了31个小时的各种场景下默读肌肉信号,主要来自于常见对话场景的词汇信号,并将这些信号送入到神经网络中进行训练。
实验结果表明在十位测试用户上达到了92%的准确率。
研究人员表示这一算法的表现还能通过更多的数据继续提高,并希望在将来用在更广泛的方面。例如在某些需要安静的场合,人们可以通过这种方式进行有效的沟通,甚至对于某些失去声音的病人来说,这样的设备不仅可以让他们重获新“声”,更为他们提供了与人、与设备交流的高效入口。
相信在未来,这样的设备会越来越多。技术不断发展的同时也在延伸着人类自我的能力,让我们想的更深、看的更多、听得越美、走的也越远。
一些参考>>
https://news.developer.nvidia.com/mit-researchers-use-ai-to-capture-silent-speech/
https://www.theguardian.com/technology/2018/apr/06/researchers-develop-device-that-can-hear-your-internal-voice
https://www.media.mit.edu/projects/alterego/overview/
https://dam-prod.media.mit.edu/x/2018/03/23/p43-kapur_BRjFwE6.pdf