人类细胞图谱是世界上最大的的单细胞参考图谱,而且还在不断增长扩大中。它包含了跨组织、器官和发育阶段的数百万个细胞的参考。这些参考资料帮助医生了解衰老、环境和疾病对细胞的影响--并最终更好地诊断和治疗病人。然而,参考图集并非没有挑战。 单细胞数据集可能包含测量误差(批处理效应),全球可用的计算资源有限,原始数据的共享往往受到法律限制。
为此,来自德国慕尼黑亥姆霍兹联合研究中心和慕尼黑工业大学(TUM)的研究人员开发了一种名为“scArches”的新型算法,是英文“single-cell architecture surgery”(单细胞结构手术)的简称。最大的优势是:“该算法不是在诊所或研究中心之间共享原始数据,而是使用转移学习将单细胞基因组学的新数据集与现有的参考资料进行比较,从而保留了隐私和匿名”。
该算法的主要科学家 Mohammad Lotfollahi 说:“这也使得对新数据集的注释和解释变得非常容易,并使单细胞参考图集的使用大大民主化”。
研究人员应用 scArches 来研究几个肺部支气管样本中的 COVID-19。他们利用单细胞转录组学将 COVID-19 患者的细胞与健康参照物进行比较。该算法能够将患病的细胞从参照物中分离出来,从而使用户能够准确定位需要治疗的细胞,对于轻度和重度 COVID-19 病例都是如此。患者之间的生物差异并没有影响绘图过程的质量。
Fabian Theis 表示“我们的愿景是,未来我们将像现在的基因组参考一样,轻松使用细胞参考。换句话说,就像你要考个蛋糕,你不需要想出自己的食谱,而是在食谱上找到一个。而通过 scArches,我们能大大简化查找过程”。
关于scArches 更多信息可以访问: https://github.com/theislab/scarches
【来源:cnBeta.COM】
网友评论