外泌体是细胞分泌的纳米级细胞外囊泡(EV),由于EV的含量、结构和大小是高度异质的,通过货物分子确定EV来源及分类具有挑战性。来自土耳其博加齐奇大学的研究人员提出了一种结合表面增强拉曼光谱(SERS)和机器学习算法的方法,用于对来自多种不同细胞系的EV进行分类,并揭示它们的细胞起源。这种机器学习辅助的SERS方法通过区分肿瘤细胞来源的外泌体与健康的外泌体,可能会为包括肿瘤在内的各种疾病的早期检测和监测开辟新的研究途径。相关研究以“Label-Free Identification of Exosomes using Raman Spectroscopy and Machine Learning”为题发表于1月15日的Small杂志上。
图:EV的样品制备和光谱分析以确定其细胞来源。a)将不同细胞系来源的EV混合在单独的溶液中,并在SERS探针上加入一滴(15μL)该溶液并干燥。b)在研究人员实验室提供的定制拉曼光谱设备中测量SERS探针上的干燥样品。采用电动工作台扫描SERS探针,通过测量光谱逐点研究EV。c)测量的拉曼光谱通过机器学习模型来识别EV的细胞来源。d)对相同的光谱进行波段成分分析,提取光谱中宽峰下的光谱信息,这些信息可以用于EV分类和识别。
外泌体是纳米级大小的细胞外囊泡(EV),被释放到细胞外空间和循环中,是细胞之间的建立通信的通道。最近,人们发现EV在医学、分子生物学和医学物理学中有广泛的应用,特别是在癌症生物学中,因为肿瘤细胞释放EV提供了结构信息和诊断潜力。根据国际细胞外囊泡学会指南, EV可以使用多种技术被表征,包括免疫印迹、透射电子显微镜(TEM)、流式细胞仪和荧光显微镜等光学成像系统。
在EV的光学检测方法中,荧光显微镜是最常用的方法之一,通常需要复杂和重复的实验方案,并且由于囊泡的大小,所使用的抗体可能无法结合到所需的区域,并且在某些情况下关于EV表面蛋白的信息有限。此外,自发荧光背景或光漂白是EV检测经常遇到的问题,使样品的荧光信号难以从背景中区分。
拉曼光谱是一种无需样品制备的振动光谱方法,它提供被测样品特有的结构信息,而不需要进行染色,也不会带来相关的结构和构象损伤。已经发表的文献中强调,肿瘤细胞和组织、细菌、病毒、红细胞、免疫细胞的疾病状态和分子谱的差异可以通过研究它们的拉曼信号来识别。
近年来,利用拉曼光谱和多变量分析/机器学习方法来表征EV越来越受到关注。这些研究大多采用传统的光谱分析方法或统计数据挖掘方法,如主成分分析(PCA)和贝叶斯分类算法(包括如线性判别分析LDA)。机器学习算法的出现极大地改进了光谱分析方法,并在EV研究中得到了应用。人工神经网络(ANN)算法(也称为深度学习)已与拉曼光谱一起用于分类来自肺癌患者和健康血浆样本的外泌体。最近,类似的方法被应用于泌尿生殖器官肿瘤和乳腺癌的研究。除肿瘤外,还在克氏±、物种、菌株和生理等水平上鉴定了病原体来源的EV。
在这项研究里,研究人员使用拉曼光谱和机器学习算法对来自五种细胞系的EV进行了化学特征的识别。研究人员制备了来自两种不同细胞系的EV的混合物,以评估该检测平台和算法的可行性。利用从不同表面点和不同SERS表面收集的数据),研究人员利用人工神经网络算法(ANN)定量地分析了以不同比例制备的EV混合物。研究人员还使用带分量分析分析了EV的拉曼光谱,揭示了一个隐藏的模式,从化学角度探索了一个分类方法。这项研究表明,预训练的机器学习算法可以使用无标记的表面增强拉曼光谱(SERS)/ ANN分析来检测肿瘤细胞衍生EV的细胞起源,以识别混合物中的外泌体特征。这些特征可以在液体活检样本中识别肿瘤细胞来源的EV,用于肿瘤的早期发现和预后。
图:五种细胞系来源的EV经过预处理步骤后的随机森林分类器结果。a)采用MATLAB四步预处理算法,得到基线校正谱。b)用阴影标准差线(±1σ)覆盖的五种不同细胞系的平均基线校正光谱。c)所有细胞系的归一化拉曼光谱的平均值。d)前两个成分的PCA得分图。e)带有暂定分配的前四个分量的PCA系数图。f)包含20%的排除异常值数据的测试集混淆表。
参考文献:Label-Free Identification of Exosomes using Raman Spectroscopy and Machine Learning. Small. 2023 Jan 15:e2205519.