医学数据的爆发式增长以及机器学习、物联网、高性能计算等科学技术的发展使医疗数据科学成为国际学术研究的热点,数据科学与医学领域的交叉融合已经并将进一步引发人类对健康福祉与生存质量新的追求。
除了大数据普遍具有的5V特性之外,医疗大数据还有其特殊性质。首先,个体差异巨大。传统医学的研究方法是将人群统计规律应用于个人。医学常用的随机对照试验用于检测诊疗方法的有效性,通常仅包括数百个患者样本,所总结出的统计规律远远不能涵盖广泛的患者,常出现误诊、治疗无效等状况。只有通过大数据的汇集,才可能更加全面地覆盖每个个体,无限逼近事实真相,为患者量身定制诊疗方案。其次,医疗数据多源、异质。每个疾病的诊治都依赖一系列的测量数据,如影像、基因、结构化与非结构化数据。这些数据在维度、波动性、测量原理、动态范围、质量等方面都有着巨大的差异,且相互关系往往不明确。通过医疗大数据可以综合各类数据,使单一数据能够协同工作,增强数据的功效。第三,医疗大数据共享困难。医疗数据由于其特有的敏感性,以及受到道德伦理、监管等方面的约束,加之技术、政策、管理等方面的制约,至今很难汇集到真正意义上的临床大数据。
本文仅就数据科学在青光眼诊治中的应用进行介绍。
青光眼视网膜结构与视觉功能数据
青光眼是一类退行性视神经疾病的总称,会导致视神经节细胞死亡或功能缺失。视神经节细胞的突触形成了视神经纤维,将整个视网膜的信号经过视盘传入大脑。见图1(a)。青光眼导致的视神经节细胞死亡与功能缺失阻断了视觉信号进入大脑的通路,在症状上体现为视网膜结构与功能的损伤。青光眼已经成为全球性的健康难题,属不可逆致盲疾病,预计到2020年患者将达到8000万[1]。早期青光眼多发于视野的边缘(图1(b)),并且损伤的空间形态各有不同,多数不易被察觉。而当损伤加重且扩散至视野中心引起患者的察觉时,往往已经对患者的生活质量产生了严重影响。目前,青光眼导致的视觉损伤是不可逆的,患者需要终生随诊跟进,以维持残留的视觉功能。对于快速恶化的患者,采用控制眼压等疗法可以有效减缓病情的恶化;对于病情平稳的患者,则可以采取强度较低的疗法。因此,青光眼临床诊治的关键是疾病的诊断与恶化的侦测,使患者尽早得到相应的治疗,尽可能维持其视觉功能的完整性。
除眼压、房角、裂隙灯等常规检查外,临床青光眼的诊治越来越依赖于量化的视网膜结构与功能测量。这些量化的测量方法为诊断和恶化侦测提供了重要依据。其中,视觉功能的测量多采用自动视野测量(图1(a)、(c))[2],例如24-2视野测量在27°的视野范围内均匀地抽样测量视网膜各空间位置的对比敏感度,范围从40dB(健康)到0dB(失明)。视网膜结构的测量则借助于各类光学成像技术(图1(d)、(e)),例如光学相干断层成像(Optical Coherence Tomography, OCT)[3]、扫描激光偏振(Scanning Laser Polarimetry, SLP)[4]、海德堡视网膜断层扫描(Heidelberg Retina Tomograph, HRT)[5]等。这些测量量化视网膜各形态特征,例如视神经纤维层厚度、视盘沿面积(体积)等。由于所有视神经均汇聚于视盘继而进入脑,这些结构测量多数集中于视盘周围,测量空间范围通常小于功能测量范围,但空间采样率较高。青光眼在视觉功能上表现为对比敏感度的下降,在视网膜结构上表现为视神经纤维层厚度与视盘沿面积的下降,以及结构、功能缺失在空间上的扩展。这些量化测量数据的积累形成了关于青光眼诊治的大数据,为研究疾病的诊断、恶化规律提供了数据基础。
视网膜结构与视觉功能的量化关系
在青光眼诊治中,视网膜结构与视觉功能两类数据之间的量化关系目前还不明确,也缺乏病理学理解,因此始终是研究的焦点。视网膜结构与视觉功能测量在空间范围、空间采样率、动态范围、统计特征等方面都截然不同,从不同角度测量视神经节细胞及其轴突的健康程度,有助于对结构-功能关系的研究,从而取长补短,形成更加准确和精确的生物标记。
早期对结构-功能关系的研究从解剖学角度出发,强调这一关系的显著的个体波动性[6]。由于 这一研究并未使用视野测量本身,因此得出的关系仅是结构-功能空间分布上的解剖学关系。在此关系的基础上,结构-功能数据间的关联分析多采用(对数)线性回归与关联的方法,将单个或多个视野采样点数据与相对应的视网膜结构测量进行独立回归或关联分析[7~9]。这类分析往往需要将结构与功能测量的像素点聚类平均为低维数据,减少测量噪声,因此得出的结构功能关系分辨率较低。同时,在统计学的角度存在两个问题:(1)不同点的结构-功能关系独立;(2)没有病理学知识表明结构-功能关系的(对数)线性特征。
通过使用扩展的多输出变量相关向量机(Relevance Vector Machine, RVM)模型,可以根据视网膜影像数据预测相应的视觉功能,进而推导出像素级非线性结构-功能关系[10]。在这一工作中,结构-功能关系被量化为视野相对于视网膜结构的导数,描述了单位视网膜结构变化引起相应视觉功能的变化量。与前述模型不同,这一方法没有使用任何结构-功能的解剖学关系,从高分辨率像素级结构测量与功能测量的数据推导出的关系与上述解剖学得出的结论一致,验证了模型的正确性。另外,在独立测试数据集上的验证表明,该方法使用视网膜结构数据对视觉功能预测的平均准确度与使用重复测量的视觉功能进行预测的平均准确度相当。
青光眼结构-功能关系的研究可以为青光眼的诊治提供临床辅助工具。在高分辨率的结构-功能关系以及对视觉功能预测的基础上,通过对比预测视觉功能与实际测量视觉功能,可以建立视网膜结构与视觉功能不一致性的量化与可视化方法[11]。这一方法表明,39%的患者存在显著的结构-功能测量的不一致性,因此两类测量无法相互替代。不同患者在结构与功能测量中得出的准确度不同,因此在临床中建议针对不同的患者特性,侧重于不同的测量方法进行随诊跟进,从而为患者建立个性化的诊疗方案。例如,图2(a)的案例中,视神经纤维层厚度预测的视野在鼻侧两点高估了测量视野。通过与“真实”视野的估算进行比较,此不一致性是由视野测量的波动性导致的,临床决策应倾向于结构测量。相反,在图2(b)的案例中,结构-功能的不一致性则是由结构测量的瑕疵造成的,临床决策应倾向于功能测量。另外,结构-功能关系的研究还为研究新的测量技术指明了方向。例如,通过对视网膜结构数据的分析,可以模拟重建视神经纤维的空间分布,为患者提供个性化的视觉功能采样点,形成新的视觉功能测量方法[12]。由于该方法通过结构数据调整相应的功能测量,有可能提高测量结果结构-功能关系。
青光眼结构-功能关系长期受到监管部门,如美国粮食与药品管理局(Food and Drug Administration, FDA)的关注。由于视觉功能客观表达了患者视觉能力的完整性,目前FDA只允许将视觉功能测量作为药物、医疗仪器实验的临床证据。但是,由于视觉功能测量时间长、所需人力多以及测量结果的波动性大,FDA始终致力于推进结构-功能关系的研究,以期视网膜结构能够被用做医学实验证据。魏因雷布(Weinreb)[13]指出,虽然通过数据科学方法已经将结构-功能关系提高至r=0.81,但将结构测量用于医学试验的主要证据还不足。事实上,由于极大的个体差异,结构与功能间很难形成完美的关系,两种测量很难相互取代。因此,目前该领域研究方向已经转移到如何利用两者的关系以及不一致性上,将两类数据进行融合,进而提高医疗决策准确度,并为患者量身定制诊治方案。
青光眼恶化侦测
青光眼的恶化侦测需要在视网膜结构与视觉功能形成的时间序列中量化疾病恶化的速率与概率,这也是临床管理过程中极为重要的环节。假阳性(将实际未恶化患者诊断为恶化)或假阴性(将实际恶化的患者诊断为未恶化)的诊断对患者以及医疗系统都会带来严重的损害。
临床青光眼恶化侦测大多采用视觉功能数据,例如视野测量。恶化侦测通常会遇到两个困难:一是诊断所依据的数据时间序列短,时间采样频率低。虽然建议每年进行3次视野功能的检测[14],但在有限的医疗资源下,跟进频率往往远远不足。二是视野测量噪声大且恶化是非平稳过程,噪声随着疾病的恶化而增加。例如,对比敏感度在32dB时,重复测量波动范围的90%置信区间为7dB,而测量20dB的重复测量90%置
信区间高达18dB[15]。同时,重复测量的波动分布是非正态的。这些特性都与多数统计与机器学习模型假设的静态高斯分布相违背。因此,青光眼恶化侦测的核心在于如何精确地利用测量数据所特有的统计特性,形成定制的量化模型。
传统的青光眼恶化侦测方法分为两类:基于事件和基于回归的方法。基于事件的方法以青光眼进展分析(Glaucoma Progression Analysis, GPA)[16]为代表,通过对比基准视野与最新视野,查看两者间的差值是否在健康人群因正常老龄化而引起的对比敏感度下降的范围内。这类方法实现简单但忽略了基准视野与最新视野之间所有的测量,也无法对恶化的速率及其统计进行明显量化。基于回归的方法将视野形成的序列相对于时间进行回归分析,最常用的方法是单点线性回归[17, 18],以量化视野上每个测试点对比敏感度的恶化速率及统计显著性。PoPLR方法[19]通过大量对时间序列的随机置换检验,改进了统计显著性的估算,但其底层方法仍然是单点的线性回归。这类方法忽略了视野测量的两个重要特性:(1)由结构-功能关系导致的测量点之间的空间关系(如图1);(2)视野测量特有的噪声分布。另外,各类机器学习方法也被用于恶化侦测。例如,采用混合高斯分布以及混合贝叶斯独立成分对视野恶化的空间模式进行分析[20],将视野恶化聚类为几个特定模式。
ANSWERS[21]是针对视野特有的数据特性设计的恶化侦测分析方法。该方法通过对短期内重复测量视野数据的分析,将测量波动性建模为混合韦伯分布,并用该分布代替回归分析中的高斯误差分布。从图3可以看出,混合韦伯分布准确地量化了测量范围内各对比敏感度重复测量的波动分布,包括视野测量特有的非平稳过程(从40dB到0dB波动性增加)、非高斯多模分布。另外,通过引入回归参数的先验概率分布,将测量点之间的空间关系通过先验概率的协方差矩阵注入模型。大样本真实临床数据表明,在假阳性率为5%时,这两方面的改进可以比现有的方法平均提前2年发现视野功能的恶化[21]。混合韦伯分布的精确度有更显著的提升,空间关系的引入对临床中常见的短时间序列(长度小于6)恶化侦测准确度也有明显的提升。同时,ANSWERS相比于传统方法还能够更加准确地预测未来视觉功能的恶化[22],可以更加精确地针对患者视觉的恶化速度制定个性化诊疗策略。在图4的例子中,临床医生需要根据三次视野测量来判定恶化趋势。传统单点的回归分析很难在如此短的时间序列中得出具有统计显著性的斜率(p<0.05),但ANSWERS方法在多个连续位置上侦测出显著恶化,并且该恶化空间形态与视神经纤维的空间分布相符。
视网膜结构测量同样能够侦测青光眼恶化,但由于目前规范标准向视觉功能倾斜,其临床应用并不广泛。但是,如何利用视网膜结构,如视神经纤维层厚度,协助视觉功能的恶化侦测,是当前研究的热点。例如,采用贝叶斯方法,将结构恶化速率与方差作为先验概率引入视野恶化的侦测模型中,提高恶化侦测以及预测未来恶化的准确率[23]。此类新型恶化侦测方法不仅为青光眼的临床决策提供更准确的量化工具,还使缩短新型药物的研发周期成为可能。例如,视神经保护药物的临床实验标准是目标药物能否减缓青光眼患者的恶化速率。计算模拟表明,结合视网膜结构的ANSWERS方法可以在1年以内侦测出对照组与用药组患者之间恶化速率的差距,将传统3~5年的视神经保护药物的临床实验缩短至1年,同时可以显著减少所需样本量,从而缩短药物研发的时间,减少研发成本[24]。
高精度影像分析
医疗影像始终是各类疾病临床诊治与医学研究的重要依据,在青光眼的诊治中也不例外。尽管各种医疗影像技术在飞速发展,但是,针对青光眼医疗影像分析的方法并没有得到相应的提升。这些方法多数将医疗影像总结为临床定义的参数(如视神经纤维层厚度、视盘沿面积等)。在诊断上,用的仍然是将患者与健康人群的参数进行对比的主流方法,看其是否超出统计界限。由于采用的是小样本数据,所追求的仅仅是统计学上的显著性,无法覆盖广泛的个体差异,所以常导致诊断误差。在恶化侦测上,主要采用测量数据在各视网膜位置相对于时间的单点回归。在面对高维度测量数据时,随机置换检验方法可以提高恶化统计显著性的估算[25]。
机器学习的方法也常被用于青光眼的诊断。但与传统方法相比,这些方法并没有什么显著的效果。另一方向的改进来自新参数的设计。例如用青光眼概率评分(Glaucoma Probability Score)方法将视盘地形图(图1e)描述为一个参数化的二次曲面和高斯曲面之和,并利用该参数化的曲面进行分类[25],其准确率虽然没有显著提升,但为此类影像分析提供了重要方向:从数据中提取的特征与临床定义的参数相比,前者或许能提供更准确的诊断信息。
青光眼的损伤多数是局部的,因此在诊断的同时还需要评估损伤的局部特征。但是,多数用于机器学习训练的临床数据只将每一幅医疗影像分为健康与患病两类,并没有关于损伤的空间信息。因此如何从二进制的分类标注中学习损伤的局部特征成为新的挑战。影像数据量不断增加,逐渐形成丰富的医疗大数据,使通过高精度影像分析来解决这一问题成为可能。视盘形态分析采用平移不变小波分析对视盘地形图进行特征提取,再使用非监督隐式高斯过程对提取的特征进行进一步降维,最后用高斯过程对视盘进行分类诊断[26]。其诊断准确度比现有的方法有所提高,但其更重要的临床价值是对青光眼局部损伤的量化。通过视盘特征在高斯过程中的梯度下降,可以推导出视盘在健康时期的理论特征参数,同时由于特征提取的两个步骤都是可逆的,测量与健康特征参数对应的影像差则量化了像素级的局部损伤。从图5中的10个例子可以看出,该方法可以详细地描述青光眼的局部损伤,其空间分辨率远超出临床提供的二进制分类。在图5(iv)中,虽然分类诊断给出的概率值并没有将该案例分类为青光眼,但已经可以观察到非常早期的楔形青光眼的局部损伤。
近10年来发展极其迅速且可用于临床青光眼诊治的影像技术是OCT。该技术可以在数秒内获取视盘与视网膜的三维影像,其分辨率和采样率可以清晰地分辨视网膜的多层组织。多年来,对OCT影像分析的研究始终集中在各类组织分层算法上[27~29]。这些算法在健康人群的影像上表现尚佳,但在面对患者影像数据时,由疾病造成的组织形变导致了大量的分层失败。一些研究使用了免组织分层的分析方法,但仍局限于影像增强等间接应用上[30]。因此,OCT影像的可靠分层方法或免分层分析方法将是该类影像分析的重要趋势。
眼动大数据中青光眼的早期诊断
随着人口快速老龄化,青光眼逐渐成为一种致盲、致残的“流行病”,给医疗系统带来沉重的负担。因此,现国际研究逐渐将青光眼的筛查防线前移,除现有低频率的临床检查外,正在研究如何在人的日常行为模式中寻找青光眼症状的蛛丝马迹。众多神经疾病包括青光眼,会引起眼动模式的变化。近年来的研究表明,青光眼会在患者执行人脸识别、驾驶、路标搜索等日常任务时带来困难,并导致眼动参数的改变[31~33]。这些参数大多采用简单的计数方式,记录注视、眼跳等行为发生的频率,虽然有足够的统计显著性来区分对照组与患者组,但区分两者的准确率仍然很低。
为了在日常生活的行为中提取更为全面的眼动模式,克莱布(Crabb)小组[34]在研究对象(32名健康人,44名青光眼患者)观看电影的时候记录了高频1000赫兹的眼动,并将有效眼跳配准对齐至视网膜黄斑区,形成观看电影过程中的眼跳分布图。该研究采用三段10分钟左右视频,为每位研究对象每段视屏建立眼跳空间分布图。通过分析不同研究对象之间眼跳分布图的区别,核主成分分析将眼跳分布图降至5维,并通过简单贝叶斯分类进行诊断。该方法在90%的特异度时可以达到76%的诊断准确率,在筛查任务中与海德堡视网膜断层扫描相当,第一次实现了在日常行为中对青光眼进行的筛查。高频眼动大数据蕴含的信息量大但杂乱无章,同时受到个体差异、个人兴趣、外部视觉刺激内容等因素的影响,目前实验还远远没有达到能够同时探索这些因素的样本量。
除了将青光眼患者与健康者进行区分外,该领域更大的挑战在于区分各类神经疾病。众多研究已经表明,脑卒中、阿兹海默症、老年黄斑病变等疾病都会带来眼动模式的改变。但这些改变在高频眼动采样下的数据表现有何差别仍然是待解决的问题。同时,这些疾病对患者抓取物体、保持平衡等行为都有着显著的影响。随着可穿戴式设备的日益更新,对人体各状态的测量数据将更加丰富,这使得在日常生活中筛查各类疾病成为可能。但是,相比于临床数据,这些数据的准确度与精确度都不高,如何通过海量高噪声大数据进行疾病筛查已经成为研究的焦点。
小结
数据科学在青光眼诊治中的应用仅仅是大量研究中的一小部分,在青光眼临床决策支持、全基因关联、病理分子机制、神经保护、远程医疗等方面,数据科学都有着广泛的应用前景,可为临床与医学研究各方面提供全面支持。目前,国际上青光眼数据的汇集速度与质量正在加速增长,未来将出现一些特定类型的大数据,为深度学习等需要极大量数据的方法提供数据基础。如何汇集连续、可对比的医疗大数据时间序列对于青光眼等慢性疾病的理解与研究至关重要。通过临床端精准化的疾病量化技术,以及日常生活中的早期筛查,数据科学将协助临床与医学研究,逐步探索控制、理解青光眼的方法,甚至在未来逆转、修复其导致的损伤。
所有评论仅代表网友意见