研究人员运用计算能力来追踪癌症的扩散
细胞的这种迁移会导致转移性疾病,该疾病导致约90%的癌症死于实体瘤,这种实体瘤是在乳房,前列腺或结肠等器官中生长的大量细胞。了解转移的驱动因素可能会导致旨在阻止癌症在体内扩散的新疗法。
“这些细胞中是否存在特定的变化或突变,以使其能够迁移?” 普林斯顿大学计算机科学教授,这项新研究的资深作者本·拉斐尔( Ben Raphael)问道 。“这是一大谜团。”
在 《自然遗传学》杂志上发表的一项 研究中,拉斐尔和他的同事提出了一种算法,该算法可以通过将DNA序列数据与有关细胞在体内位置的信息整合在一起来跟踪癌症的转移。他们称其为MACHINA,代表“转移和克隆病史综合分析”。
Raphael说:“我们的算法使研究人员能够从当前获得的DNA序列数据推断过去的转移过程。”
与以往仅基于DNA序列的方法所进行的研究相比,该技术对癌症迁移历史的描述更为清晰。这些研究中的一些推断出复杂的迁移模式,并未反映出当前对癌症生物学的了解。
拉斐尔说:“如今,我们获得的数据集非常复杂,但是复杂的数据集并不总是需要复杂的解释。”
通过同时追踪细胞的突变和运动,MACHINA发现某些患者的转移性疾病可能是由于细胞迁移少于以前所认为的。例如,在一名乳腺癌患者中,先前发表的一项分析提出转移性疾病是由14个单独的迁移事件引起的,而MACHINA建议在肺中的单个继发性肿瘤仅通过5次细胞迁移即可播种剩余的转移灶。除了乳腺癌数据集外,Raphael和他的团队还应用他们的算法来分析黑色素瘤,卵巢癌和前列腺癌患者的转移模式。
几个附加功能有助于提高MACHINA的准确性。该算法包括一个基于遗传证据的肿瘤细胞竞争模型,该模型基于实验证据,即肿瘤细胞可以成簇地传播到体内的新部位。这也说明了DNA数据的不确定性,这些不确定性来自对遗传上不同的肿瘤细胞和健康细胞进行混合测序。
伦敦癌症研究所进化与癌症研究员Chris Rokos研究员Andrea Sottoriva说,这种方法克服了许多挑战,无法从肿瘤DNA测序产生的“难以分析,嘈杂”的数据中得出有意义的结论。他说:“我预计这种新方法将在基因组界得到广泛使用,并将为癌症发展的最致命阶段提供新的思路。”
MACHINA的发展为在大型癌症患者队列中更广泛地检查转移模式铺平了道路,这可能揭示出导致不同类型癌症扩散的关键突变。
Raphael还计划通过整合来自肿瘤DNA和血液中循环的肿瘤细胞的数据以及表观遗传学变化(DNA的可逆化学修饰)来使该方法更强大。
“更好的算法就像更好的显微镜一样,” Raphael说。“用放大镜观察大自然时,您可能会错过重要的细节。如果您用显微镜看,您会发现更多。”