根据最新的全球癌症统计数据,乳腺癌是最常见的癌症形式之一,是全球女性癌症死亡的第二大原因。乳腺癌的准确诊断关乎预后情况,然而仍缺乏准确诊断的策略。近日,南方医科大学南方医院郑磊教授课题组与香港科技大学姚舒怀教授课题组合作在Biosensors and Bioelectronics杂志上发表了学术论文,报道了一种基于4-plex ddPCR技术并联合机器学习算法的新策略,通过分析sEVs来源的mRNA,构建了3种乳腺癌诊断模型。结果显示,相对于传统的统计分析,显著提高了乳腺癌的诊断效能。PGR、ESR1和ERBB2分别是孕酮受体(PR)、雌激素受体1 (ER)和人表皮生长因子受体2 (HER2)的表达基因。临床上根据免疫组化(IHC)中PR、ER、HER2的表达情况将乳腺癌分为5种类型,这与乳腺癌的临床治疗有关。有研究报道从石蜡组织切片中提取的PGR、ESR1和ERBB2 mRNA可用于乳腺癌的分型和预测预后。然而,它们在乳腺癌中的诊断作用未见报道。该研究团队提出推测乳腺癌组织分泌入外周血的sEVs可能携带PGR、ESR 1和ERBB2 mRNA,具有乳腺癌早期诊断的潜力。机器学习(Machine learning,ML)作为人工智能重要的一个分支,通过对已知数据包括图像、文本和生物信号等进行学习,构建决策系统,进而对未知来源数据进行预测和分组,被广泛地应用于疾病诊断,它可以准确地解决许多诊断任务。然而基于机器学习对sEVs多指标mRNA进行同时分析构建计算模型用于乳腺癌诊断尚未见报道。图1:乳腺癌多重ddPCR检测和机器学习辅助诊断原理图该课题的设计原理图如图1所示。首先,对血浆来源的sEVs进行RNA提取和逆转录以产生相应的cDNA。随后将其与检测靶标对应的引物探针混合,通过液滴生成芯片产生微液滴。通过对靶基因设置不同浓度的Taqman探针,使得微液滴经过热循环反应后的终点荧光在FAM和CY5荧光通道中展示出不同的荧光强度,在微滴分布的二维 (2D)图中表现为多种荧光液滴团簇。计算团簇中液滴的数量,用于不同靶基因的绝对定量。随后,使用ML算法分析获得的4-plex ddPCR数据。将数据随机分为70%和30%。70%的数据用于三种ML算法(随机森林、神经网络 和支持向量机)的训练以构建诊断模型,然后将30%的数据用于乳腺癌或者乳腺良性疾病的预测和分类。借助ML辅助诊断模型,可以通过将预测与病理诊断患者的实际情况进行比较,进一步评估不同sEV来源mRNA组合的诊断效能。
图2:随机森林诊断模型下不同生物标志物组合用于区分乳腺癌患者与健康人的诊断性能
以其中一个ML诊断模型为例,图2 A-C显示了随机森林(Random forest, RF)诊断模型下不同标记组合用于区分乳腺癌与健康组的预测值。预测值越接近0或1,预测的准确性就越高。根据预测值,进行ROC分析以评估RF下不同生物标志物组合的诊断效能(图2D-F)。图2G显示了不同标志物组合的灵敏度、特异性和AUC值。在RF的辅助下,单个标志物区分乳腺癌与健康组的诊断性能比没有RF辅助的有显著提高。对于PGR mRNA,无RF帮助下AUC值为0.8697(95% CI=0.6089-0.8816),而在RF帮助下AUC值为0.9167 (95% CI=0.8067-1.000);对于ESR1 mRNA,无ML帮助下AUC 值为0.8270(95% CI=0.7155-0.93905) ,而在ML帮助下AUC 值为0.9167 (95% CI=0.93905-1.000);对于ERBB2 mRNA,无ML帮助下AUC值为0.7948 (95% CI=0.6533-0.9364),而在ML帮助下AUC值为0.8553(95% CI=0.6274-1.000)。此外,随着生物标志物数量的增加,诊断性能也逐渐提高,当三个标志物联合应用AUC值为1.000(95%CI=1.000-1.000),灵敏度为94.74%(95%CI=75.36-99.73) ,特异度为100% (95% CI=60.97-100.0)。该研究,成功开发了一种4-plex ddPCR结合ML算法的研究策略以改善乳腺癌的诊断。多重ddPCR可以同时定量4种sEV mRNA,并评估了它们的相对表达水平。三种ML算法(RF,NN和SVM)通过对不同疾病分组的4-plex ddPCR获得的数据进行训练,以构建乳腺癌诊断模型。在ML的帮助下,不仅为乳腺癌诊断提供了最佳的标志物组合,而且为显着提高乳腺癌诊断的性能提供了一种新的研究策略。Liu, C.; Li, B.; Lin, H.;Yang, C.; Guo, J.; Cui, B.; Pan, W.; Feng, J.; Luo, T.; Chu, F.; Xu, X.; Zheng,L.; Yao, S., Multiplexed analysis of small extracellular vesicle-derived mRNAs by droplet digital PCR and machine learning improves breast cancer diagnosis. Biosensorsand Bioelectronics 2021, 194, 113615.外泌体资讯网 Biosensors and Bioelectronics:基于液滴数字PCR联合机器学习多重分析sEVs来源mRNA提高乳腺癌诊断研究