公众号/将门创投
来源:IBM Research Blog 编译:Lin
青光眼是世界上导致失明的第二大原因。仅在美国,这一病症就影响了约270万人。它是一种复杂的疾病,如果不及时治疗可能导致失明。这在澳大利亚也是个特别严重的问题,其中只有50%的人被确诊为青光眼并接受相应的治疗。
目前,IBM和纽约大学科学家团队正在研究,可以利用深度学习来帮助眼科医生和验光师进一步检测眼部图像的新方法,这一方法也可有助于加快在图像中检测青光眼的过程。
在最近的一篇论文中,研究人员详细介绍了一种新的深度学习框架,该框架直接从原始光学相干断层扫描(OCT)成像中检测青光眼,这种方法利用的是光波拍摄视网膜的横截面图像。该方法达到了94%的准确率,且无需对数据进行任何额外的分割或清理——通常在传统的方法中这一步骤通常非常耗时。
青光眼(顶行)和健康眼(底行)中网络检测区域的可视化
现在,人们使用各种测试方法来诊断青光眼,例如眼压测量和视野测试、眼底和OCT成像。但OCT提供了一种有效的方法来可视化和量化眼睛中的结构,即视网膜神经纤维层(RNFL),它随着疾病的进展而变化。
虽然这种方法效果良好,但它需要额外的过程来量化OCT图像中的视网膜神经纤维层。这些技术通常需要配合各种方式来对输入数据进行处理,例如将所有眼睛图片翻转到相同的方向(左或右)以减少数据的可变性,从而改善分类器的性能。而研究人员新提出的方法消除了这些额外的步骤,保留了检测中最重要的部分。
在624名受试者(217名健康受试者和432名青光眼患者)中,研究人员建立了利用深度学习进行检测的新方法,准确地检测出了94%的青光眼患者,而之前提到的技术仅发现了86%的患者。研究人员表示准确性的提升是由于对图像中结构自动分割错误的消除,以及新方法包含了目前临床上尚未使用的眼底特征进行了分类。
此外,与目前使用更大更深层网络的人工智能研究趋势相反,研究人员使用的网络是一个小型的5层网络,这主要是由于医疗数据由于其隐私性不易获取。这种数据稀缺使得大型网络的使用在许多医疗应用中不切实际。即使在研究中有时也会看到“越少越佳”的特点,此外,在较小的网络上训练这些算法可以让它们更高效地运行。
数据被输入如下图所示的卷积神经网络(CNN)。网络由5个3D卷积层组成,并使用ReLU激活和批量归一化,滤波器组大小为32-32-32-32-32,滤波器尺寸为7-5-3-3-3,步幅为2-1-1-1-1。在最后的卷积层之后采用全局平均合并,并利用全连接的softmax输出层以实现类标签的预测和类激活图(CAM)的计算。网络架构的一个重要方面是选择3D卷积以允许计算3D类激活图。卷积神经网络的5个输入层沿第一维度(例如,颜色通道)聚合输入数据。在2D卷积的情况下,所得到的类激活图将是2D的,且深度信息丢失。因此通过采用3D卷积,这使我们能够识别光学相干断层扫描体积内对疾病分类很重要的区域。
通过随机超参数探索优化了网络体系结构的各个方面,例如层数、每层滤波器组数、滤波器大小、步幅和批量归一化的使用;类似于为基于特征的方法执行的超参数优化。网络实现的曲线下面积用于选择最佳网络。研究人员从网络架构搜索中排除了最大池化,因为它可以被stride卷积取代。
卷积神经网络在Keras中实现,Tensorflow作为后端。使用nut-flow/ml进行数据分离、分层和预处理。通过降采样,每个阶段对数据进行分层。通过随机遮挡、平移、左右眼翻转、沿着表面轴的小旋转(±10度)和混合来增强训练数据。同时研究人员还在没有任何扩充的情况下训练了网络,并报告了相应的曲线下面积。在训练期间具有最高准确度的曲线下面积的网络被保存。
这只是IBM目前研究应用人工智能的一个方面。在最近宣布的新合作中,IBM Research和George&Matilda (G&M) 将利用G&M强大的匿名临床数据和成像研究数据集,来探索使用深度学习模型和成像分析的方法,以支持临床医生在图像中识别和检测眼部疾病——包括青光眼。研究人员还将研究青光眼的潜在生物标志物,这有助于更好地了解疾病进展。