【导读】2017 年医疗人工智能发展迅速,产业格局风起云涌。人工智能在医疗领域中的应用已非常广泛,包括医学影像、临床决策支持、语音识别、药物挖掘、健康管理、病理学等众多领域。本白皮书梳理和研究国际、国内医疗人工智能的发展状况,总结医疗人工智能行业及基础设施领域国内外的技术发展特点和趋势,分析我国医疗人工智能产业面临的政策环境,为政府及产业界决策提供参考。
报告来源:互联网医疗健康产业联盟
医疗人工智能技术与应用白皮书(2018)
▌前 言
2017 年医疗人工智能发展迅速,产业格局风起云涌。人工智能在医疗领域中的应用已非常广泛,包括医学影像、临床决策支持、语音识别、药物挖掘、健康管理、病理学等众多领域。人工智能技术呈现与医疗领域不断融合的趋势,其中数据资源、计算能力、算法模型等基础条件的日臻成熟成为行业技术发展的重要力量。在新形势下,我国医疗人工智能的发展面临着机遇和挑战,技术能力不断增强,但产品和服务仍需完善。
本白皮书梳理和研究国际、国内医疗人工智能的发展状况,总结医疗人工智能行业及基础设施领域国内外的技术发展特点和趋势,分析我国医疗人工智能产业面临的政策环境,为政府及产业界决策提供参考。
▌一、人工智能的发展
从上世纪八九十年代的 PC 时代到二十一世纪的互联网时代,信息技术改造了人类的生产方式,提高了生产效率,改善了我们的生活。在进入移动互联网时代后,万物互联成为趋势,但技术的限制导致移动互联网难以催生出更多的新应用和新业态。如今,人工智能俨然已经成为这个时代最炙手可热的技术,甚至将成为未来十年内信息技术产业发展的焦点。
人工智能的概念诞生于上世纪 50 年代,从最初的神经网络和模糊逻辑,到现在的深度学习、图像搜索,人工智能技术经历了一系列的起伏。在 1956 年的一次科学会议上,人工智能的概念被首次确立:让机器像人那样思考和认知,用计算机实现对人脑的模拟。上世纪50 年代至 70 年代是人工智能的早期发展阶段,该阶段人工智能主要用于解决一些小型的数学问题和逻辑问题。此时人工智能出现了一些代表性应用,如机器定理证明、机器翻译、专家系统、模式识别等,但是该阶段人工智能仍可以被归纳为“弱人工智能”时代,其发展和应用还远远不能达到人类的智慧水平。
1972 年,用于传染性血液诊断和处方的知识工程系统 MYCIN 研发成功,该事件标志着人工智能进入“专家系统”时期。专家系统的出现使得计算机可以和人进行结合,通过对数据的分析解决一些实际的问题。但是专家系统的发展并不顺利,也并未得到广泛的应用。其原因主要有两个方面。一是专业知识的获取需要行业内长时间的积累,大量的行业数据在彼时难以全部植入专家系统。二是专家系统的程序主要由解释性语言“LIPS”编写,其开发效率和易用性较低,难以实现实际应用。人工智能技术发展在彼时陷入的瓶颈使得人类开始思考,如何让计算机自发理解和归纳数据,掌握数据间的规律,即“机器学习”。
上世纪 90 年代末,IBM“深蓝”计算机击败国际象棋大师卡斯帕罗夫再次引发了全球对人工智能技术的关注。但是受限于当时的技术条件,人工智能尚无法支撑大规模的商业化应用。2006 年,Geoffrey Hinton教授发表的论文《A Fast Learning Algorithm for Deep Belief Nets》中提出了深层神经网络逐层训练的高效算法,使当时计算条件下的神经网络模型训练成为了可能。
人工智能的概念虽然在上世纪已经出现,但由于彼时软硬件条件的不成熟,数据资源的短缺,人工智能并未实现广泛的应用。如今,随着算法、算力等基础技术条件的日渐成熟,行业数据的积累,人工智能得以应用在各个领域。
算力。GPU(图形处理器)显著提升了计算机的性能,拥有远超CPU 的并行计算能力。由于处理器的计算方式不同,CPU 擅长处理面向操作系统和应用程序的通用计算任务,而 GPU 擅长完成与显示相关的数据处理。CPU 计算使用基于 x86 指令集的串行架构,适合快速完成计算任务。GPU 拥有多内核处理并行计算,适合处理 3D 图像中上百万的图像像素。此外,FPGA 也在越来越多地应用在 AI 领域。FPGA(Field Programmable Gate Array)是在 PAL、GAL、CPLD 等可编程逻辑器件的基础上进一步发展的产物。它是作为专用集成电路领域中的一种半定制电路而出现的,既解决了全定制电路的不足,又克服了原有可编程逻辑器件门电路数有限的缺点。一方面,FPGA 是可编程重构的硬件,相比 GPU 有更强大的可调控能力;另一方面,与日增长的门资源和内存带宽使得它有更大的设计空间。由于深层神经网络包含多个隐藏层,大量神经元之间的联系计算具有高并行性的特点,具备支撑大规模并行计算的 FPGA 和 GPU 架构已成为了现阶段深度学习的主流硬件平台。FPGA 和 GPU 架构能够根据应用的特点定制计算和存储的结构,方便算法进行微调和优化,实现硬件与算法的最佳匹配,获得较高的性能功耗比。
算法。深度学习是当前研究和应用的热点算法,也是人工智能的重要领域。深度学习通过构建多隐层模型和学习海量训练数据,可以获取到数据有用的特征。通过数据挖掘进行海量数据处理,自动学习数据特征,尤其适用于包含少量未标识数据的大数据集。深度学习采用层次网络结构进行逐层特征变换,将样本的特征表示变换到一个新的特征空间,从而使分类或预测更加容易。深度学习驱动图像识别精度大幅度提升。2012 年, 深度学习模型首次被应用在图像识别大赛(ImageNet),将错误率降至16.4%,一举夺冠。2015 年,微软通过152 层的深度网络,将图像识别错误率降至 3.57%,而人眼的辨识错误率约在 5.1%,Deep Learning 模型的识别能力已经超过了人眼。在2017 年的 ImageNet 挑战赛中,Momenta 团队利用 SENet 架构夺魁,他们的融合模型在测试集上获得了 2.251% 的错误率,对比于去年第一名的结果 2.991%,获得了将近 25% 的精度提升。
自 Hinton 提出 DBN(深度置信网络)以来,深度学习的发展经历了一个快速迭代的周期,其中卷积神经网络(Convolutional Neural Network,CNN)目前已成为图像识别领域应用最广泛的算法模型。在利用卷积神经网络(CNN)进行图像理解的过程中,图像以像素矩阵形式作为原始输入,第一层神经网络的学习功能通常是检测特定方向和形状的边缘的存在与否,以及这些边缘在图像中的位置;第二层往往会检测多种边缘的特定布局,同时忽略边缘位置的微小变化;第三层可以把特定的边缘布局组合成为实际物体的某个部分;后续的层次将会通过全连接层来把这些部分组合起来,实现物体的识别。目前,CNN 已广泛应用于医疗健康行业特别是医疗影像辅助诊断,用以实现病变检测和特定疾病的早期筛查。
大数据。机器学习是人工智能的核心和基础,而数据和以往的经验是机器学习优化计算机程序的性能标准。随着大数据时代的到来,来自全球的海量数据为人工智能的发展提供了良好的基础。据 IDC 统计,2011 年全球数据总量已经达到 1.8ZB,并以每两年翻一番的速度增长,预计到 2020 年全球将总共拥有 35ZB 的数据量,数据量增长近20 倍;数据规模方面,预计到 2020 年,全球大数据产业规模将达到2047 亿美元,我国产业规模将突破万亿元 。
随着电子病历的实施,CT 影像、磁共振成像等放射图像的普及,医疗行业的数据量已呈现指数级增长。据统计,2013 年全球医疗健康数据量为 153EB,预计年增长率为 48%。通过自然语言理解、机器学习等技术,大量文本、视频、图像等非结构化数据得以分析利用。来源于三甲医院的电子病历数据库,基层医院和体检机构的健康档案数据库,国家各统计部门的人口数据库通过大数据技术可以实现互联互通,形成个人完整生命周期的医疗健康大数据,为人工智能技术在医疗健康行业的应用提供了有力的支撑。
2017 年 7 月 20 日,国务院正式印发《新一代人工智能发展规划》(以下简称《规划》),提出了面向 2030 年我国新一代人工智能发展的指导思想、战略目标、重点任务和保障措施,部署构筑我国人工智能发展的先发优势,加快建设创新型国家和世界科技强国,描绘了我国新一代人工智能发展的蓝图。《规划》指出以提升新一代人工智能科技创新能力为主攻方向,构建开放协同的人工智能科技创新体系,把握人工智能技术属性和社会属性高度融合的特征,坚持人工智能研发攻关、产品应用和产业培育“三位一体”推进。其中,对于涉及民生需求的医疗、养老等方面,《规划》重点提出应加快人工智能创新应用,为公众提供个性化、多元化、高品质服务,包括:推广应用人工智能治疗新模式新手段,建立快速精准的智能医疗体系;探索智慧医院建设,开发人机协同的手术机器人、智能诊疗助手,研发柔性可穿戴、生物兼容的生理监测系统,研发人机协同临床智能诊疗方案,实现智能影像识别、病理分型和智能多学科会诊;基于人工智能开展大规模基因组识别、蛋白组学、代谢组学等研究和新药研发,推进医药监管智能化;加强流行病智能监测和防控。同时,国家也从重大科技专项角度支持医疗人工智能发展,医学人工智能成为了 2018 年科技部重大专项的重点。2017 年 5 月份,我国科技部发布《“十三五”卫生与健康科技创新专项规划》,提出加快引领性技术的创新突破和应用发展,攻克一批急需突破的先进临床诊治关键技术。重点部署生命组学、基因操作、精准医学、医学人工智能、疾病早期发现、新型检测与成像、生物治疗、微创治疗等前沿及共性技术研发,提升我国医学前沿领域原创水平,增强创新驱动源头供给,加快前沿技术创新及临床转化。《“十三五”卫生与健康科技创新专项规划》对推进医学人工智能的技术发展指明了具体方向:开展医学大数据分析和机器学习等技术研究,开发集中式智能和分布式智能等多种技术方案,重点支持机器智能辅助个性化诊断、精准治疗辅助决策支持系统、辅助康复和照看等研究,支撑智慧医疗发展。
▌二、医疗人工智能的宝贵价值
医疗行业长期存在优质医生资源分配不均,诊断误诊漏诊率较高,医疗费用成本过高,放射科、病理科等科室医生培养周期长,医生资源供需缺口大等问题。随着近些年深度学习技术的不断进步,人工智能逐步从前沿技术转变为现实应用。在医疗健康行业,人工智能的应用场景越发丰富,人工智能技术也逐渐成为影响医疗行业发展,提升医疗服务水平的重要因素。与互联网技术在医疗行业的应用不同,人工智能对医疗行业的改造包括生产力的提高,生产方式的改变,底层技术的驱动,上层应用的丰富。通过人工智能在医疗领域的应用,可以提高医疗诊断准确率与效率;提高患者自诊比例,降低患者对医生的需求量;辅助医生进行病变检测,实现疾病早期筛查;大幅提高新药研发效率,降低制药时间与成本。
医疗数据中有超过 90%的数据来自于医学影像,但是对医学影像的诊断依赖于人工主观分析。人工分析只能凭借经验去判断,容易发生误判。据中国医学会数据资料显示,中国临床医疗每年的误诊人数约为 5700 万人,总误诊率为 27.8%,器官异位误诊率为 60%。以心肌绞痛病症为例,其早期临床表现轻微,除胸口痛外,常会伴随出现肩部到手部内侧疼痛,精神焦虑,血压异常等寻常体征现象,对于门诊医生而言很容易发生误诊。对于病理医生而言,从众多细胞中依靠经验找到微小的癌变细胞难度较大,诊断错误现象时有发生。人工智能技术的出现已经在一定程度上缓解了以上问题。利用图像识别技术,
通过大量学习医学影像,人工智能辅助诊断产品可以辅助医生进行病灶区域定位,有效缓解漏诊误诊问题。
据统计,我国每千人平均医生拥有量仅为 2.1 人 2,医生资源缺口问题较为严重。医生资源缺口问题在影像科、病理科方面尤为严重。
目前我国医学影像数据的年增长率约为 30%,而放射科医师数量的年增长率仅为4.1%。放射科医师数量的增长远不及影像数据增长。这个现象意味着放射科医师在未来处理影像数据的压力会越来越大,甚至远远超过负荷。供需不对称的问题在病理方面表现尤甚。据统计,我国病理医生缺口达到 10 万,而培养病理医生的周期却很长,这意味着此问题短期内将无法解决。面对严重的稀缺资源缺口问题,人工智能技术或将带来解决这个难题的答案。人工智能辅助诊断技术应用在某些特定病种领域,甚至可以代替医生完成疾病筛查任务,这将大幅提高医疗机构、医生的工作效率,减少不合理的医疗支出。
多数疾病都是可以预防的,但是由于疾病通常在发病前期表征并不明显,到病况加重之际才会被发现。虽然医生可以借助工具进行疾辅助预测,但人体的复杂性、疾病的多样性会影响预测的准确程度。人工智能技术与医疗健康可穿戴设备的结合可以实现疾病的风险预测和实际干预。风险预测包括对个人健康状况的预警,以及对流行病等公共卫生事件的监控;干预则主要指针对不同患者的个性化的健康管理和健康咨询服务。
利用传统手段的药物研发需要进行大量的模拟测试,周期长、成本高。目前业界已尝试利用人工智能开发虚拟筛选技术,发现靶点、筛选药物,以取代或增强传统的高通量筛选(HTS)过程,提高潜在药物的筛选速度和成功率。通过深度学习和自然语言处理技术可以理解和分析医学文献、论文、专利、基因组数据中的信息,从中找出相应的候选药物,并筛选出针对特定疾病有效的化合物,从而大幅缩减研发时间与成本。
智能手术机器人是一种计算机辅助的新型的人机外科手术平台,主要利用空间导航控制技术,将医学影像处理辅助诊断系统、机器人以及外科医师进行了有效的结合。手术机器人不同于传统的手术概念,外科医生可以远离手术台操纵机器进行手术,是世界微创外科领域一项革命性的突破。目前达芬奇机器人是世界上最为先进的微创外科手术系统之一,集成了三维高清视野、可转腕手术器械和直觉式动作控制三大特性,使医生将微创技术更广泛地应用于复杂的外科手术。相比于传统手术需要输血,会带来传染疾病等危险,机器人做手术则出血很少。此外,手术机器人可以保证精准定位误差不到 1 毫米,对于一些对精确切口要求非常高的手术实用性很高。
▌三、国内外医疗人工智能发展状况及分析
据统计,到 2025 年人工智能应用市场总值将达到 1270 亿美元,其中医疗行业将占市场规模的五分之一。我国正处于医疗人工智能的风口:2016 年中国人工智能+医疗市场规模达到 96.61 亿元,增长37.9%;2017 年将超过 130 亿元,增长 40.7%;2018 年有望达到 200亿元。投资方面,据 IDC 发布报告的数据显示,2017 年全球对人工智能和认知计算领域的投资将迅猛增长 60%,达到125亿美元,在2020年将进一步增加到 460 亿美元。其中,针对医疗人工智能行业的投资也呈现逐年增长的趋势。其中 2016 年总交易额为 7.48 亿美元,总交易数为 90 起,均达到历史最高值。
国内外科技巨头均重视人工智能技术在医疗领域的布局与应用。IBM 在2006年启动Watson项目,于2014年投资10亿美元成立Watson事业集团。Watson 是一个通过自然语言处理和机器学习,从非结构化数据中洞察数据规律的技术平台。Watson 将散落在各处的知识片段连接起来,进行推理、分析、对比、归纳、总结和论证,获取深入的洞察以及决策的证据。2015 年,沃森健康(Watson Health)成立,专注于利用认知计算系统为医疗健康行业提供解决方案。Watson 通过和一家癌症中心合作,对大量临床知识、基因组数据、病历信息、医学文献进行深度学习,建立了基于证据的临床辅助决策支持系统。目前该系统已应用于肿瘤、心血管疾病、糖尿病等领域的诊断和治疗,并于 2016 年进入中国市场,在国内众多医院进行了推广。
Watson 在医疗行业的成功应用标志着认知型医疗时代的到来,该解决方案不仅可以提高诊断的准确率和效率,还可以提供个性化的癌症治疗方案。此外,谷歌、微软等也都纷纷布局医疗 AI。2014 年谷歌收购DeepMind 公司,后开发知名的人工智能程序 AlphaGo。在基础技术层面,谷歌的开源平台 TensorFlow 是当今应用最广泛的深度学习框架。在医疗健康领域,Google 旗下的 DeepMind Health 和英国国家医疗服务体系 NHS(National Health Service)展开合作,DeepMind Health可以访问 NHS 的患者数据进行深度学习,训练有关脑部癌症的识别模型。微软将人工智能技术用于医疗健康计划“Hanover”,寻找最有效的药物和治疗方案。此外,微软研究院有多个关于医疗健康的研究项目。Biomedical Natural Language Processing 利用机器学习从医学文献和电子病历中挖掘有效信息,结合患者基因信息研发用于辅助医生进行诊疗的推荐决策系统。
国内科技巨头也纷纷开始在医疗人工智能领域布局,各家公司均投入大量资金与资源,但各自的发展重点与发展策略并不相同。例如,阿里健康以云平台为依托,结合自主机器学习平台 PAI2.0 构建了坚实而完善的基础技术支撑。同时,阿里健康与浙江大学医学院附属第一医院、浙江大学第二附属医院等医院、上海交通大学医学院附属新华医院以及第三方医学影像中心建立了合作伙伴关系,重点打造医学影像智能诊断平台,提供三维影像重建、远程智能诊断等服务。此外,阿里云联合英特尔、零氪科技联合举办了天池医疗 AI 大赛。该大赛面向全球第一高发恶性肿瘤——肺癌,以肺部小结节病变的智能识别、诊断为课题,开展大数据与人工智能技术在肺癌早期影像诊断上的应用探索。大赛基于阿里云天池大数据平台,邀请全球生物、医疗、人工智能等众多领域的校内团队、专家学者、医疗企业参赛。参赛者使用大赛提供的数千份胸部 CT 扫描数据集进行预训练,在此基础上开发算法模型,检测 CT 影像中的肺部结节区域。准确率排名靠前的参赛者将进入决赛,决赛要求参赛者提交诊断结果的 CSV 文件,并标记检测到的结节坐标,最终根据参赛者给出的坐标信息判断结节是否检测正确,如果结节落在以参考标准为中心半径为 R 的球体中,则认为检测正确。大赛通过探索早期肺癌精确智能诊断的优秀算法,提升早期肺癌检测的准确度,降低临床上常见的假阳性的误诊发生,实现“早发现,早诊断,早治疗”。同时,本次大赛能够激发传统医学与机器学习的碰撞与融合,为整体学科发展进行探路与思辨,推动了人工智能技术在医疗影像诊断上的应用。
腾讯在人工智能领域的布局涵盖基础研究、产品研发、投资与孵化等多个方面。腾讯在 2016 年建立了人工智能实验室 AI lab,专注于 AI 技术的基础研究和应用探索。2017 年 11 月,在“2017 腾讯全球合作伙伴大会”上腾讯宣布了自己的“AI 生态计划”,旨在开放AI 技术,并结合资本机构孵化医疗 AI 创业项目。2017 年 4 月,腾讯向碳云智能投资 1.5 亿美元。碳云智能由原华大基因 CEO 王俊牵头组建,致力于建立人工智能的内核模型,并对健康风险进行预警、进行精准诊疗和个性化医疗。在产品研发方面,腾讯在 2017 年 8 月推出了自己首个应用在医学领域的 AI 产品腾讯觅影。腾讯觅影把图像识别、深度学习等领先的技术与医学跨界融合,可以辅助医生对食管癌进行筛查,有效提高筛查准确度,促进准确治疗。除了食管癌,腾讯觅影未来也将支持早期肺癌、糖尿病性视网膜病变、乳腺癌等病种的早期筛查。
在国际上权威的肺结节检测比赛 LUNA 中,中国企业参赛队伍阿里云 ET 和科大讯飞均取得了优异的成绩。科大讯飞医学影像团队以92.3%的召回率刷新了世界记录。召回率是指成功发现的结节数在样本数据中总节结数的占比。召回率是评测诊断准确率的重要指标,召回率低代表遗漏了患者的关键病灶信息,因此科大讯飞团队采用了多尺度、多模型集成学习的方法显著提升了召回率,同时针对假阳性导致的医生重复检测问题,创新性地使用结节分割和特征图融合的策略进行改善。在诊断效率方面,科大讯飞团队采用 3D CNN 模型来计算特征图,并在特征图上进行检测,并通过预训练大幅提升了检测效率,实现薄层 CT 的秒级别处理。
▌四、我国医疗人工智能细分领域
人工智能与医疗的结合方式较多,就医流程方面包括诊前、诊中、诊后;适用对象方面包括医院、医生、患者、药企、检验机构等;从赋能医疗行业的角度分析,包括降低医疗成本,提高诊断效率等多种模式。我国医疗人工智能企业聚焦的应用场景集中在虚拟助理、病历与文献分析、医疗影像辅助诊断、药物研发、基因测序等领域。
虚拟助理是指通过语音识别、自然语言处理等技术,将患者的病症描述与标准的医学指南作对比,为用户提供医疗咨询、自诊、导诊等服务的信息系统。智能问诊是虚拟助理广泛应用的场景之一。智能问诊是指机器通过语义识别与用户进行沟通,听懂用户对于症状的描述,再根据医疗信息数据库进行对比和深度学习,对患者提供诊疗建议,包括用户可能患有的健康隐患,应当在医院进行复诊的门诊科目等。通用型的虚拟助手如苹果 Siri、微软 Cortana 等与用户沟通时,用户可以自由输入,由虚拟助手进行语义理解。医疗领域的虚拟助手与通用型的虚拟助手和用户的沟通方式不同,因为普通用户难以使用准确的医学用语去描述自己的问题。因此,医疗虚拟助手在帮助用户进行智能问诊时通常采用选择题的形式。
智能问诊在医生端和用户端均发挥了较大的作用。在医生端,智能问诊可以辅助医生诊断,尤其是受限于基层医疗机构全科医生数量、质量的不足,医疗设备条件的欠缺,基层医疗成为了我国分级诊疗发展的瓶颈。人工智能虚拟助手可以帮助基层医生进行对一些常见病的筛查,以及重大疾病的预警与监控,帮助基层医生更好地完成转诊的工作,这是人工智能问诊在医生端的价值体现。
在用户端,人工智能虚拟助手能够帮助普通用户完成健康咨询、导诊等服务。在很多情况下,用户身体只是稍感不适,并不需要进入医院进行就诊。人工智能虚拟助手可以根据用户的描述定位到用户的健康问题,提供轻问诊服务和用药指导。2017 年,康夫子、大数医达等公司研发的智能预问诊系统得到了在多家医院的落地应用。预问诊系统是基于自然语言理解、医疗知识图谱及自然语言生成等技术实现的问诊系统。患者在就诊前使用预问诊系统填写病情相关信息,由系统生成规范、详细的门诊电子病历发送给医生。预问诊系统采用层次转移的设计架构模拟医生进行问诊,既能有逻辑地像医生一样询问基本信息、疾病、症状、治疗情况、既往史等信息,同时可以围绕任一症状、病史等进行细节特征的问诊。除问诊外,预问诊系统基于自然语言生成技术自动生成规范、详细的问诊报告,主要包括:患者基本信息、主诉、现病史、既往史和过敏史五个部分。此外,语音识别技术为医生书写病历,为普通用户在医院导诊提供了极大的便利。当放射科医生、外科医生、口腔科医生工作时双手无法空闲出来去书写病历,智能语音录入可以解放医生的双手,帮助医生通过语音输入完成查阅资料、文献精准推送等工作,并将医生口述的医嘱按照患者基本信息、检查史、病史、检查指标、检查结果等形式形成结构化的电子病历,大幅提升了医生的工作效率。科大讯飞的智能语音产品“云医声”为了应对医院科室内嘈杂的环境,达到更好的语音处理效果,开发了医生专用麦克风,可以过滤掉噪音及干扰信息,将医生口述的内容转换成文字。目前,讯飞医疗的语音转录准确率已超过 97%,同时推出了 22 种方言的版本,并已在北大口腔、瑞金医院等超过 20 家医院落地使用。科大讯飞的另一款产品“晓医”导诊机器人利用科大讯飞的智能语音和人工智能技术,能够通过与患者进行对话理解患者的需求,实现智能地院内导诊,告诉患者科室位置、应就诊的科室,并解答患者就诊过程中遇到的其他问题,实现导医导诊,进一步助力分诊。“晓医”机器人目前已在安徽省立医院、北京 301 医院等多家医院投入使用。
电子病历是在传统病历基础上,记录医生与病人的交互过程以及病情发展情况的电子化病情档案,包含病案首页、检验结果、住院记录、手术记录、医嘱等信息。其中既有结构化数据,也包括大量自由文本输入的非结构化数据。对电子病历及医学文献中的海量医疗大数据进行分析,有利于促进医学研究,同时也为医疗器械、药物的研发提供了基础。人工智能利用机器学习和自然语言处理技术可以自动抓取来源于异构系统的病历与文献数据,并形成结构化的医疗数据库。
大数医达、惠每医疗、森亿智能等企业正是基于自己构建的知识图谱,形成了供医生使用的临床决策支持产品,为医生的诊断提供辅助,包括病情评估、诊疗建议、药物禁忌等。
构建医疗知识图谱的过程需经过医学知识抽取、医学知识融合的过程。在医学知识抽取过程中,传统的基于医学词典及规则的实体抽取方法存在诸多弊端。首先,目前没有医学词典能够完整地囊括所有类型的生物命名实体,此外同一词语根据上下文语境的不同可能会指代的是不同实体,因此简单的文本匹配算法无法识别实体。近年来,深度学习开始被广泛应用于医学实体识别,目前实验结果表明基于BiLSTM-CRF 的模型能够达到最好的识别效果。由于数据来源的多样性,在医学知识融合的过程中存在近义词需要进行归类,目前分类回归树算法、SVM 分类方法在实体对齐的过程中可以实现良好的效果。和其他行业相比,分散在医疗信息化各个业务系统中的数据包含管理、临床、区域人口信息等多种数据,复杂性更高,隐藏价值更大。
新华三等企业在 2017 年大力推进利用大数据技术挖掘医疗数据价值,助力人工智能与精准医疗。通过大数据平台充分挖掘各种类型数据的价值,帮助实现辅助诊断、精准医疗、临床科研等多种目标。大数据平台通过自然语言处理技术,对电子病历中的自由文本进行分词、实体识别、依存句法分析、信息提取等操作,实现自由文本结构化。在实现病历结构化的基础上,利用机器学习聚类分析建立诊断建议模型,从而为医生的临床决策提供支持。对电子病历的结构化和数据挖掘,可以帮助一线人员及科研人员挖掘疾病规律,进行疾病相关性分析、患病原因分析、疾病谱分析等,并建立新的研究课题。例如,新华三在协助医院进行关于卵巢癌的相关课题研究时,得出血小板与淋巴细胞的关系对卵巢癌诊断具有重要价值。
医疗影像数据是医疗数据的重要组成部分,从数量上看超过 90%以上的医疗数据都是影像数据,从产生数据的设备来看包括 CT、X 光、MRI、PET 等医疗影像数据。据统计,医学影像数据年增长率为 63%,而放射科医生数量年增长率仅为 2%,放射科医生供给缺口很大。人工智能技术与医疗影像的结合有望缓解此类问题。人工智能技术在医疗影像的应用主要指通过计算机视觉技术对医疗影像进行快速读片和智能诊断。人工智能在医学影像中应用主要分为两部分: 一是感知数据,即通过图像识别技术对医学影像进行分析,获取有效信息;二是数据学习、训练环节,通过深度学习海量的影像数据和临床诊断数据,不断对模型进行训练,促使其掌握诊断能力。目前,人工智能技术与医疗影像诊断的结合场景包括肺癌检查、糖网眼底检查、食管癌检查以及部分疾病的核医学检查和病理检查等。利用人工智能技术进行肺部肿瘤良性恶性的判断步骤主要包括:数据收集、数据预处理、图像分割、肺结节标记、模型训练、分类预测。首先要获取放射性设备如 CT 扫描的序列影像,并对图像进行预处理以消除原 CT 图像中的边界噪声,然后利用分割算法生成肺部区域图像,并对肺结节区域进行标记。数据获取后,对 3D 卷积神经网络的模型进行训练,以实现在肺部影像中寻找结节位置并对结节性质进行分类判断。
食管癌是常见恶性肿瘤之一,据统计,我国 2015 年新发食管癌人数为 47.7 万,占全球患病人数的 50%。针对食管癌的早期治疗是诊疗的关键,食管癌早期五年内治疗的生存率超过 90%,而进展期/晚期五年生存率则小于 15%。但是由于基层医疗机构医生缺乏足够的认知以及筛查手段,导致我国对早期食管癌的检出率较低。利用人工智能技术辅助医生对食管癌进行筛查,可以有效提高筛查准确度与检测效率。腾讯公司研发的觅影 AI 针对食管癌的早期筛查准确率可超过 90%,并且完成一次内镜检查的时间已经可控制在数秒之内。阿尔茨海默病,俗称老年痴呆症,是一种发病进程缓慢、随着时间不断恶化的持续性神经功能障碍,该疾病的真正成因至今仍不明确,没有可以阻止或逆转病程的治疗。在我国,对该病症的重视程度不高,现已造成就诊率低、诊断率低、治疗率低的“三低”局面。根据国际阿尔茨海默病联合会报告,2015 年中国阿尔茨海默病患者超过 950 万,患病人数已居世界第一,且仍在快速增长,2050 年或将达到 3000 万。阿尔茨海默症在患病早期是可以干预的,但检测却相对困难,越早检测出这种病症,患者就越有机会提早寻求治疗,减缓病情的影响。阿尔茨海默病的临床诊断需要通过神经心理学测验、血液学检查、结构影像学或功能影像学检查、脑电图等方式综合判断。
阿尔茨海默病的诊疗难点在于症状以及检查指标等的非特异性,较难实现早期诊断。雅森科技等企业通过输入核磁、脑电图和量表三种不同类型的数据,综合运用机器训练、统计分析和深度学习的方法,找出患者是否患病与输入信息之间的关系。对于阿尔茨海默病诊断所用到的人工智能,已不只是传统意义上的深度学习对医学影像的识别,而是在此基础上找出多种信息源之间的联系,并基于这三种数据训练多模态神经网络训练模型,从而提前两至三年预测老年痴呆发病的可能性以及病情发展的阶段。
糖网病是糖尿病引起的视网膜病变。据统计,我国约 5 亿人处于糖尿病前期,糖尿病患者约有 1.1 亿人,糖网病患者约有 3000 万。
对糖尿病患者进行眼底筛查具有重要意义,因为糖网病患者通常早期难以发觉患有疾病,症状表现不明显,只有经过眼底早期筛查,及时发现糖网病,及早干预,才能有效抵制疾病的发生。相较于其他疾病的诊断需要结合临床信息,人工智能在糖网眼底领域的检查具备更高的可操作性,因为仅针对眼部图像的检查就具备较高的诊疗价值。针对渗出或者出血等病变,AI 系统也可以实现较高的准确率。在 2017年,众多企业、科研机构均进行了关于此方面的研究。例如,中国移动通信有限公司研究院与沈阳何氏眼科医院有限公司深度合作,研发眼底图像质量评估、糖尿病视网膜病变严重程度分级、糖网病变病灶位置检测等智能算法。首先对所采集的眼底图像质量是否合格(即是否满足病理分析要求)进行评估,并对质量合格的眼底图像,分析其为左眼或右眼、是否存在眼底疾病、糖网病变严重程度的分级(如有糖网),并检测眼底图像中出现微动脉瘤、出血、渗出等糖网病变病灶的具体位置,最终自动生成结构化筛查报告,为患者提供转诊建议。
中国移动研究院面向基层医院、眼视光中心、社区服务站、乡村诊所等基层筛查场景,将专业眼科影像设备采集的眼底图像通过固网或移动蜂窝网上传至云端,利用先进的人工智能、深度学习技术进行分析,实现眼底致盲疾病的自动筛查、糖尿病视网膜病变(如有)严重程度分级以及病灶位置检测和跟踪,其结果供临床医生参考,施行必要的干预、治疗,使广泛、低成本、快速响应的规模化筛查成为可能。病理是医学界的金标准,也是许多疾病诊断的最终确定指标。但是,病理医生通常必须花费大量的时间检查病理切片,因为病理医生需要在上亿级像素的病理图片中识别微小的癌细胞。对于同一种疾病的病理诊断,不同的医生往往会得出不同的判断结论,足见病理诊断存在的误诊问题。人工智能技术为数字病理诊断带来了技术革新,帮助病理医生提高效率避免遗漏。相较于 CT、X 光等影像的人工智能辅助诊断,病理人工智能辅助诊断难度更大,因为病理的诊断既要观察整体,还要观察局部;不只要学习细胞特征,还要学习其生物行为。
我国已有兰丁高科、泰立瑞、迪英加科技等众多企业开始研究利用人工智能辅助数字病理诊断,他们开发的人工智能辅助诊断系统针对乳腺癌、宫颈癌等疾病的病理检查已实现较高的准确率。
人工智能正在重构新药研发的流程,大幅提升药物制成的效率。传统药物研发需要投入大量的时间与金钱,制药公司平均成功研发一款新药需要 10 亿美元及 10 年左右的时间。药物研发需要经历靶点筛选、药物挖掘、临床试验、药物优化等阶段。目前我国制药企业纷纷布局 AI 领域,主要应用在新药发现和临床试验阶段。
靶点筛选。靶点是指药物与机体生物大分子的结合部位,通常涉及受体、酶、离子通道、转运体、免疫系统、基因等。现代新药研究与开发的关键首先是寻找、确定和制备药物筛选靶—分子药靶。传统寻找靶点的方式是将市面上已有的药物与人体身上的一万多个靶点进行交叉匹配以发现新的有效的结合点。人工智能技术有望改善这一过程。AI 可以从海量医学文献、论文、专利、临床试验信息等非结构化数据中寻找到可用的信息,并提取生物学知识,进行生物化学预测。据预测,该方法有望将药物研发时间和成本各缩短约 50%。
药物挖掘。药物挖掘也可以称为先导化合物筛选,是要将制药行业积累的数以百万计的小分子化合物进行组合实验,寻找具有某种生物活性和化学结构的化合物,用于进一步的结构改造和修饰。人工智能技术在该过程中的应用有两种方案,一是开发虚拟筛选技术取代高通量筛选,二是利用图像识别技术优化高通量筛选过程。利用图像识别技术,可以评估不同疾病的细胞模型在给药后的特征与效果,预测有效的候选药物。
病人招募。据统计,90%的临床试验未能及时招募到足够数量和质量的患者。利用人工智能技术对患者病历进行分析,可以更精准的挖掘到目标患者,提高招募患者效率。
药物晶型预测。药物晶型对于制药企业十分重要,熔点、溶解度等因素决定了药物临床效果,同时具有巨大的专利价值。利用人工智能可以高效地动态配置药物晶型,防止漏掉重要晶型,缩短晶型开发周期,减少成本。
基因测序是一种新型基因检测技术,它通过分析测定基因序列,可用于临床的遗传病诊断、产前筛查、罹患肿瘤预测与治疗等领域。单个人类基因组拥有 30 亿个碱基对,编码约 23000 个含有功能性的基因,基因检测就是通过解码从海量数据中挖掘有效信息。目前高通量测序技术的运算层面主要为解码和记录,较难以实现基因解读,所以从基因序列中挖掘出的有效信息十分有限。人工智能技术的介入可改善目前的瓶颈。通过建立初始数学模型,将健康人的全基因组序列和RNA序列导入模型进行训练,让模型学习到健康人的 RNA剪切模式。
之后通过其他分子生物学方法对训练后的模型进行修正,最后对照病例数据检验模型的准确性。
目前,IBM 沃森,国内的华大基因、博奥生物、金域检验等龙头企业均已开始自己的人工智能布局。以金域检验为例,金域检验利用其综合检验检测技术平台,以疾病为导向设立检测中心,融合生物技术与人工智能等新一代信息技术为广大患者提供专业化的临床检验服务。金域检验的基因组检测中心拥有全基因组扫描、荧光原位杂交、细胞遗传学、传统 PCR 信息平台,并利用基因测序领域中最具变革性的新技术之高通量测序技术(HTS)为临床提供高通量、大规模、自动化及全方位的基因检测服务。同时,金域检验依托覆盖全国 90%以上的人口所在地区、年服务医疗机构 21000 多家和年标本量超 4000万例的覆盖全国不同地域、不同民族、不同年龄层次的海量医疗检测样本数据,创建了具有广州特色的“精准医疗”检验检测大数据研究院。
▌五、面临的问题与挑战
数据是人工智能技术最重要的因素之一。对于机器学习而言,模型越复杂、越具有强表达能力越容易降低对未来数据的解释能力,而专注于解释训练数据。这种现象会导致训练数据效果很好,但遇到未知的测试数据预测效果会大幅降低,即发生过拟合现象,从而也就需要更多的数据来避免该问题的发生,以保证训练的模型对新的数据也能有良好的预测表现。对于医疗人工智能而言,数据的重要性更为明显。以医疗影像辅助诊断公司为例,企业训练模型的数据来源通常是公开数据集,或者企业与个别医院合作获取的影像数据。这种模式在企业创业初期可以维持,但是当企业发展到一定阶段时弊端会开始出现。以肺结节 CT 筛查为例,企业通常与个别医院展开合作,获取该医院 CT 设备的数据。但是,目前市面上广泛流通的 CT 设备商有七到八家,机型则达到了上百种,企业在与医院合作时是针对某一机型的设备进行的数据训练,该模型在适用于其他机型时,如果一些诸如层厚、电流、电压、扫描时间等参数不同,模型需要重新针对新机型进行数据预训练。除此以外,病人受检测时的姿势(平躺或者趴窝),CT 长宽 512 像素或者 768 像素的差别,不同排数机器的层厚差异以及薄层重构算法都是会对模型训练产生影响的因素。因此,数据问题的解决是保证医疗影像辅助诊断产品是否能够广泛应用的关键,广泛开展合作,加深数据的积累以及技术上的创新或是下一步行业发展的重点。
目前,业内针对肺结节、糖网病检查等场景的医疗人工智能产品诊断准确率普遍很高,但是真实情况并非如此乐观。企业在训练自己模型时通常都有自己的数据库,各自的算法都是按照自己的数据进行训练,然后以自己的数据来验证准确性。在没有得到临床验证前,基于标准或特定数据集的实验室测试结果并不具备较大的意义,因为实际临床应用的场景是非常复杂的。具体体现在以下几个方面:
以糖网病筛查为例,瞳孔较小、晶状体浑浊等人群的免散瞳眼底彩照,图像质量往往达不到筛查的要求。此外,受限于成本因素,很多基层医疗机构使用的是手持眼底相机,成像质量堪忧。
在病理方面,数据缺少通用的国际标准,各医院使用的病理切片扫描仪厂家也并不一致,各扫描仪厂商的扫描文件数据格式多数为私有格式,数据的标准化需要各厂家与医院积极配合,开放自己的数据存储格式。
目前图像识别技术在医疗影像辅助诊断上的应用已经取得了比较好的应用,技术上也取得了较大的突破,但是医疗影像辅助诊断产品下一步应当完善自己的算法,避免“就图论图”。以甲状腺结节诊断为例,医生诊断的依据并非只是彩超的拍片结果,还要结合甲状腺功能化验,查看抗体的相关表现。因此,将临床表征信息、患者基本信息、LIS 指标、随访记录等都作为预测模型的因子,实现多模态的诊断体系将是医疗影像辅助诊断产品下一步重点突破的方向。
现在的医疗人工智能企业多数是依靠单点医疗机构开展工作,合作方式较为单一,数据作为医院资产也难以供企业放置于院外使用。
此外,医疗人工智能产品想以销售软件的形式让医院付费,不论从计费方式、软件资质等方面都较为困难。因此,建立可持续的商业模式是医疗人工智能行业长久发展的关键。与政府、医院开展合作,向医疗机构提供服务或是解决方案之一。例如,四川华西医院与希氏异构医疗科技有限公司联合成立华西-希氏医学人工智能研发中心,在消化内镜人工智能技术研发方面开展了合作。正如华西医院院长李为民所言:“华西-希氏医学人工智能研发中心,既是四川大学华西医院产学研用协同创新的重大科技转化平台,也是华西医院以开放姿态释放医院资源的重要标志”。目前华西医院与公司的合作已取得了进展,医生可以上传胃镜图像,通过在云端进行数据分析,可以对胃癌、静脉曲张、息肉等常见胃镜检查结果进行筛查,目前准确率超过 90%。基于 AI 的消化胃镜智能系统可以提供高质量的检测结果,提高医生诊断效率,提升基层医疗机构的服务水平。另外一个案例是,一款用于肺癌早期筛查的 APP 与上海某区政府签署合作协议,企业进入社区基层为广大居民提供疾病筛查服务,政府给予相应补贴。
人工智能不论在学习能力还是成本控制方面,都具备发挥能力的空间,可以为普通用户和医生带来帮助。但是,人工智能帮助进行辅助诊断在医疗责任认定方面也存在问题和挑战。例如,用户在使用医疗虚拟助手表达主诉时,可能会漏掉甚至错误地进行描述,导致虚拟助手提供的建议是不符合用户原本的疾病情况的。因此,目前监管部门禁止虚拟助手软件提供任何疾病的诊断建议,只允许提供用户健康轻问诊咨询服务。我国监管部门对于利用人工智能技术提供诊断功能是审核要求非常严格。在 2017 年 CFDA 发布的新版《医疗器械分类目录》中的分类规定,若诊断软件通过算法提供诊断建议,仅有辅助诊断功能不直接给出诊断结论,则按照二类医疗器械申报认证;如果对病变部位进行自动识别并提供明确诊断提示,则必须按照第三类医疗器械进行临床试验认证管理。未来,应进一步明确针对 AI 诊断进入临床应用的法律标准,做出 AI 诊断的主体在法律上是医生还是医疗器械,AI 诊断出现缺陷或医疗过失的判断依据等问题。
人才专业水平是人工智能发展的关键因素之一。目前,我国从事人工智能行业的从业人员数不足 5 万人,每年通过高校培养出来的技术人员也不足 2000 人,人工智能人才缺口较大。相比于数据资源较为充足,我国的人工智能人才储备较发达国家差距较大。据统计,在人工智能行业从业者当中,美国拥有 10 年以上工作经验的人才占比接近 50%,而我国只有不到 25%。此外,我国同时掌握医疗与人工智能知识的复合型人才更是匮乏。因此,只有解决人才问题,我国才能突破医疗人工智能行业发展的瓶颈。基于此背景,我国高度重视人工智能培养,并制定《新一代人工智能发展规划》国家战略,指出要把高端人才队伍建设作为人工智能发展的重中之重。2017 年 11 月,科技部在京召开新一代人工智能发展规划暨重大科技项目启动会,科技部、发改委、财政部等联合成立人工智能规划推进办公室,宣布首批四个专项开放创新平台的依托单位,其中包括依托腾讯公司建设医疗影像国家人工智能开放创新平台。我国现已通过建设国家级开放平台集聚高端人才,通过鼓励深度交叉学科研究,推进产学研合作的新模式加速人才培养。