简介

骨髓增生异常综合征(MDS)是一组伴有骨髓造血细胞发育不良伴细胞减少的血液肿瘤。MDS发育不良分为红细胞发育不良、颗粒发育不良和巨核细胞发育不良。发育不良的特征是细胞大小、成核、分割和造粒异常123..诊断MDS伴单系异常增生或MDS伴多系异常增生仅当异常增生满足每个谱系中10%或以上细胞的标准时才有可能。尽管异常增生的检测在MDS的诊断中起着关键作用4,它需要血液科医生花费大量的时间和精力来阅读。此外,由于不典型增生的评估是主观的,难以量化,因此需要一种更有效的工具来进行骨髓抽吸涂片解释的质量控制和标准化5

最近,深度学习技术在各个医疗领域被用于提高诊断的准确性。利用人工智能(AI)对骨髓标本图像的研究主要集中在各种类型白血病母细胞的检测和正常骨髓细胞的分化67891011.对于骨髓抽吸标本,由于标本本身的局限性,包括可变载玻片、外周血稀释、干抽等,迄今为止尚未积极开展研究12.虽然MDS中的AI可以提高异常发育细胞的阅读和量化的准确性和速度,但该领域的研究仍然缺乏。

到目前为止,在对MDS使用深度学习的研究中,Mori等人使用卷积神经网络(CNN)方法分析了“颗粒减少”,颗粒生成中的一种发育不良。13.在另一项研究中,Kimura等人使用CNN开发了一种自动图像分析系统,可以在外周血中区分MDS和再生障碍性贫血(AA)14.在以往的研究中,仅针对与颗粒减少相关的发育不良作为研究对象。大多数研究使用外周血或活检,只有少数研究使用骨髓抽吸。由于以往的研究没有考虑作为诊断标准的骨髓抽吸涂片中的各种细胞类型,因此需要进一步的研究。在这项研究中,我们开发并评估了一种算法,该算法使用深度学习技术自动区分造血细胞谱系,并在MDS患者的骨髓抽吸涂片中检测异常发育细胞。

结果

人口学和临床特征

MDS患者与正常切片患者的特点见表1.MDS患者中位年龄为71.5岁,正常组中位年龄为66.5岁。两组患者的中位年龄和性别差异无统计学意义。其中,EB -2型MDS占12例(35.5%),MLD型MDS占11例(32.4%),EB-1型MDS占6例(17.6%)。MDS伴单系发育不良、环状铁母细胞- mld、治疗相关-MDS和MDS-不可分类患者分别为1例、2例、1例和1例。在细胞遗传学特征方面,15例(44.1%)患者核型正常,10例(29.4%)患者染色体增加和/或丢失,4例(11.8%)患者染色体模式复杂。在发育异常的特征方面,31例(91.2%)有造血功能障碍,15例(44.1%)有颗粒发育障碍,21例(61.8%)有巨核发育障碍(表2)2).在造血功能障碍的病例中,5例患者出现核萌芽,9例患者出现巨幼细胞改变,12例患者出现多核。在颗粒生成异常的情况下,分别有6例、10例和3例患者观察到颗粒减少、核分割不良和异常大。在巨核发育不良的病例中,13例患者观察到微巨核细胞,8例患者观察到核低发育,10例患者观察到多核发育。

表1入组患者特征及人口学统计。
表2本研究中使用的细胞图像数量。

骨髓抽吸玻片细胞的检测

用于评估的补丁图像总数为11000张。使用946个细胞对有核细胞进行手工标记。共有756个(80%)细胞被用作训练集,190个细胞(20%)被用于验证。使用U-net进行训练的Dice系数得分为74.7%,验证的Dice系数得分为71.1%。在相同的架构下,交叉优于联合的训练和验证性能分别为62.3%和58.0%。利用标记和分割结果,识别细胞的位置,并进行细胞特异性裁剪,获得555,052张细胞图像。我们将8065个细胞分为8种类型[正常红细胞(EN),正常粒细胞(GN),正常巨核细胞(MN),发育不良红细胞(ED),发育不良粒细胞(GD),发育不良巨核细胞(MD),母细胞和其他]。表中列出了数据集中每个分类单元的图像数量2.我们将8065个细胞随机分为训练集(80%)、验证集(10%)和测试集(10%)。

正常与发育不良骨髓细胞的鉴别性能

表格3.介绍本研究的表现,包括敏感性、特异性、准确性、阳性预测值(PPV)、阴性预测值(NPV)、受试者工作特征曲线下面积(AUC)、F1评分和8种细胞类型的平均精密度。GD的AUC为0.996,敏感性为90.0%,特异性为99.9%。ED和MD的敏感性分别为79.0%和89.9%。ED的特异性为99.2%,MD的特异性为94.8%。与发育异常的细胞相比,正常模式的细胞的敏感性和特异性降低。EN、GN和MN的敏感性分别为64.0%、79.7%和70.7%,敏感性分别为95.0%、99.3%和98.8%。数字1给出每种单元类型的接收器工作特性曲线。图中还显示了GN(0.993)、ED(0.972)、MD(0.971)、MN(0.955)和EN(0.945)的可靠结果3.,无花果。1).

表3性能汇总,包括数据库中每个发现的接收器工作特征曲线下的面积。
图1
图1

骨髓增生异常患者正常和异常细胞分类的受试者工作特征曲线。八种类型的细胞:正常红细胞(EN)、正常粒细胞(GN)、正常巨核细胞(MN)、发育不良红细胞(ED)、发育不良粒细胞(GD)、发育不良巨核细胞(MD)、母细胞和其他。

真假分析

表中列出了标记细胞的混淆矩阵和细胞的预测4.在异常发育细胞中,该算法漏检的细胞比例最高的是同一谱系的正常细胞,其中24%的ED(24/100)被预测为EN, 9.2%的GD(12/130)被预测为GN, 5.3%的MD(1/19)被预测为MN。在ED患者中,9个(9%)细胞被错误预测为GD, 7个(5.4%)细胞被错误预测为GD。在MD病例中,ED、GD和其他病例中错误预测的细胞数量各为一个。正常细胞中,巨核细胞均被解读为巨核谱系细胞,5例(10.0%)MN被预测为MD。在粒细胞和红细胞的情况下,17例(5.9%)GN被错误预测为GD, 16例(13.4%)EN被错误预测为ED。补充图。1展示了使用深度学习(DL)算法正确检测和错误预测的细胞示例。

表4数据集疾病诊断的混淆矩阵。

讨论

在本研究中,我们开发并验证了一种基于dl的MDS患者骨髓抽吸异常发育细胞分类算法。该算法在按照红细胞生成、颗粒生成和巨核细胞生成三种细胞系对异常发育细胞和正常细胞进行分类时表现出良好的性能。AUC总体表现为0.945 ~ 0.996。

由于样本本身的局限性,包括整个幻灯片的可变性,骨髓抽吸中自动细胞检测和分类的相关研究不容易应用于人工智能。此外,与其他领域相比,相关的人工智能研究还没有积极开展12.Mori等人分析了一种基于dl的发育不良评估,专门用于MDS患者发育不良特征之一的颗粒减少检测系统,并报告了AUC为0.944,准确性为97.2%13.本研究是首次利用骨髓涂片标本进行MDS细胞鉴别分析。我们的研究扩展了之前的研究,包括造血功能障碍、巨核功能障碍和颗粒功能障碍。此外,还包括了各种类型的异常粒级生成,如核低分割和GD以外的异常大尺寸,可以开发改进的算法。此外,与Mori等人的研究相似,GD在三种发育不良细胞系中表现最好。GD的敏感性、特异性、AUC、准确性、PPV、NPV和F1评分最高。在大多数患者的骨髓中,大部分有核细胞为粒细胞生成异常,在诊断MDS时比粒细胞生成异常更具特异性15.从这个角度来看,GD可以作为开发应用dl的MDS诊断算法的关键因素。

本研究特异性、AUC、准确率较高,敏感性、F1评分、AP值较低,未达到专家的阅读能力。本研究是一个多分类不平衡模型;因此,在性能评价工具中,定义为精密度和召回率值调和平均值的F1分数可能适合解释。在F1得分方面,本研究的表现在0.643 - 0.938之间。应用梯度加权类激活映射(Grad-CAM)热图生成技术来推断假阳性或阴性的几个原因16.该技术突出显示了CNN中骨髓核细胞的感兴趣区域,并可以聚焦图像中用于预测的重要区域,有助于算法的解释。通过Grad-CAM,我们发现ED以细胞核为中心的图像能够正确预测,这是检测dyserythropoesis的关键。Grad-CAM热图显示GD和MD被正确预测,在细胞核和细胞质中也被正确检测,因此适用于发育不良特征。相反,在ED被错误地预测为EN的情况下,细胞质而不是细胞核被聚焦。在ED的巨幼细胞改变的情况下,它很难阅读,因为它被预测为EN。颗粒减少的GD由于细胞质低颗粒,有时被解读为EN或ED,当低颗粒严重时,也被解读为其他。在GD的情况下,与伪pelger - huet异常形状和/或颗粒减少相比,核低分割显示难以与红系细胞分化。

尽管基于dl的异常发育细胞检测还没有表现出可以取代血液学家的性能,但它作为基于骨髓的诊断的辅助工具是重要的。到目前为止,大多数血细胞的鉴别研究都是在外周血或骨髓活检中进行的10141718.然而,近年来,一种正常骨髓细胞分化的算法被开发并发表,对发育不良的研究也开始了,为利用AI检测MDS提供了基础91119.由于骨髓抽吸载玻片含有许多有核细胞,而且读取的区域很广,因此在引入DL的初级分类时,它有几个优点。例如,可以减少测试报告的周转时间并计算更多的细胞,从而提高计算有核细胞百分比的准确性。此外,不典型增生的诊断不再依靠专家的主观判断,而是可以通过AI实现更多的标准化。最近,一篇关于整张幻灯片图像检测的论文已经发表,预计DL阅读和数字图像的访问将会增加20..除了鉴定总体正常骨髓细胞外,还需要更多的研究来接近每种疾病的DL。MDS具有独特的细胞形态和性质4.有必要根据各种发育不良建立包含细胞图像和基因组数据的数据库,并开发一种新的疾病分类和预测预后的方法。在这项研究中,使用了常用的深度学习网络InceptionV3架构,并可能在未来的各种研究中进行扩展。这项研究的后续研究,如在每个患者的疾病水平上研究全自动诊断方法,以及应用于发育不良细胞的病理。

本研究的局限性是无法单独训练每个细胞系发育不良的详细形态表现。然而,可以推断,通过确保足够数量的正常细胞,有效的分化是可能的。如果今后根据其详细特征对发育不良进行分类,则有望取得更高的成绩。其次,每个类的单元格数量的比例不能统一。与其他世系相比,颗粒发生细胞数量相对较多;因此,有可能获得更好的性能。因此,在本研究的解释中,每个细胞的谱系性能应考虑数值差异来确定。最后,本研究仅分析了基于细胞的性能,还需要开发更多的疾病诊断性能以用于实际的临床应用。通过后续研究,我们打算开发一种算法,该算法将分析骨髓中所有有核细胞的每个谱系中发育不良细胞的百分比,并作为诊断MDS的有用工具。

在本研究中,我们开发了一种分类算法,可以区分MDS患者骨髓抽吸涂片中三种谱系的正常和发育不良细胞。本研究开发的算法可作为诊断MDS患者的辅助工具,有望为缩短MDS骨髓抽吸诊断时间和规范目视读数做出贡献。

方法

临床标本及全玻片扫描

数据集准备和深度学习构建的流程如图所示。2.本研究根据《赫尔辛基宣言》的指导方针进行,并得到江南圣心医院机构审查委员会(IRB)的批准。HKS 2021-07-023),由于该研究的匿名性,该研究放弃了知情同意的需要。研究中使用的数据是公开的。根据WHO 2016年MDS诊断标准,采集34例MDS患者骨髓抽吸图像21,取24张正常骨髓玻片进行骨髓检查。正常骨髓来自于接受初始淋巴瘤常规分期的患者,没有恶性血液肿瘤和/或反应性骨髓的迹象。骨髓涂片用Wright-Giemsa染色。骨髓抽吸玻片全程扫描使用Motic Digital slide Assistant软件版本1.0.7.61 (Motic中国集团有限公司,厦门,中国)。

图2
图2

数据集准备和建议框架。

骨髓抽吸玻片中有核细胞的自动鉴定

包含有核细胞的理想细胞分布区域的图像被手动捕获为补丁图像。修补的映像总数为11,000个。对946个细胞进行人工标记有核细胞,并对修补图像的细胞检测算法进行分割(图。3.).这种分割任务,包括骨髓细胞的检测和描绘,是使用U-Net进行的。U-Net描绘了有核细胞的边界,并从背景微环境中分割出感兴趣的细胞区域。

图3
图3

有核细胞的手工标记过程。(一个骨髓抽吸玻片全片扫描(B)基于web的辅助注释界面,可以手动标记有核细胞。

基于CNN的细胞识别算法的开发

细胞分为8种类型(EN, GN, MN, ED, GD, MD,原细胞和其他)。正常和发育不良的细胞被分配到包括并合并MDS患者和正常骨髓标本的有核细胞。所有细胞图像均由两名分别具有6年和23年实验室医学经验的血液学家根据已发表的标准指南进行回顾性和独立审查。每个图像都由两名血液学家复查,他们之间的分歧通过共识解决。我们使用6453个细胞图像(80.0%)进行训练,806个细胞图像(10.0%)用于验证,806个图像(10.0%)用于测试。我们使用了DEEP:PHI(医疗人工智能软件:DEEPNOID,首尔,韩国)中的度量模块,这是一个帮助DL模型研究的开放平台。使用DEEP:PHI平台进行统计分析。我们使用著名的对象检测DL框架InceptionV3架构对骨髓细胞进行逐图像分类22.采用梯度cam技术对DL输出进行解释和评价16.采用自适应矩估计优化器进行超参数设置,学习率为0.0001。批大小为32,epoch数为200。

统计和数据分析

利用度量相似度的统计工具骰子系数评分来评价U-net的分割效果。评估细胞分类的AUC、敏感性、特异性、PPV、NPV、准确度、F1评分和平均精密度。曲线上的值表示绩效程度:无歧视(AUC < 0.5)、可接受(0.5≤AUC < 0.7)、优秀(0.7≤AUC < 0.9)、优秀(0.9≤AUC)23