最近Nucleic Acids Research杂志在线发表了首个人类血液外泌体长链RNA数据库exoRBase(www.exoRBase.org),收录了上万条环状RNA(circRNA)、长链非编码RNA(lncRNA)和mRNA。该数据库由复旦大学附属肿瘤医院/肿瘤研究所(复旦肿瘤所)黄胜林课题组完成,这是该课题组继2015年Cell Research首次报道环状RNA富集于外泌体并存在于血液中的工作延续。
外泌体是近年的研究热点,作为纳米级别的小囊泡却有强大的功能和应用前景,特别是存在于体液中,是目前液体活检关注的重要领域。外泌体是由活细胞分泌的,包裹着细胞来源的核酸和蛋白等活性分子,具有介导细胞间的通讯等作用,由于携带了反映来源细胞的特异性信息,是理想的生物标志物。长链RNA包括mRNA、lncRNA和circRNA等,这些RNA数量多且存在很多组织细胞特异表达信息,以往认为它们主要在细胞内,不会存在于体液中(体液中存在很多RNA酶),近年发现它们可能被外泌体包裹释放到体液中,可作为外泌体RNA在疾病中的诊断标志物或功能靶点。与以往研究较多的miRNA相比,长链RNA数量远远大于miRNA(血液miRNA不足1000个),而且可能携带来源细胞的特异性信息,对外泌体长链RNA的研究正越来越受关注。黄胜林课题组在前期基础上,改进并完善了血液外泌体长链RNA的高通量测序方法,通过对正常人和不同疾病外泌体RNA的测序分析,发现血液外泌体存在着几万条的环状RNA、长链非编码RNA和mRNA。exoRBase正是基于这些分析基础上建立,旨在收录正常人和不同疾病患者血液外泌体里所有的长链RNA信息及其表达特征。
exoRBase建立了一套针对外泌体RNA测序数据分析的标准流程,对环状RNA进行了预测和注释分析,同时比对和定量了lncRNA和mRNA表达情况。为确定血液外泌体RNA的组织来源,作者基于GTEx数据库的30个不同组织的RNA测序表达数据,计算了每一个lncRNA和mRNA的组织特异性得分,针对外泌体与其关联组织进行血液外泌体RNA来源的推测。数据库可从多种角度(基因名、染色体定位、circRNA关联基因等)进行检索,并找到具有不同特性的外泌体RNA,及其组织特异性、疾病关联性和表达情况。目前数据库收录的样本包括32例正常人和少量疾病患者的数据,共记录了58 330 circRNAs,15 501 lncRNAs和18 333 mRNAs。exoRBase将为外泌体长链RNA研究和液体诊断提供有力的信息平台和靶点。
该数据库的基础RNA测序数据分析主要是基于烈冰科技的NovelBrain®云平台(www.novelbrain.com)。烈冰科技独立开发的基因大数据分析平台(NovelBrain®)拥有强大的高性能计算能力、完善的样本及大数据管理系统,同时具备深度挖掘能力,并支持定制化分析模块自主上线。
外泌体资讯网 复旦大学发表首个人类血液外泌体长链RNA数据库