机器学习发现癌症免疫疗法成功的多种因素
马里兰大学领导的研究团队正在使用人工智能的一个分支,即机器学习,以更好地将免疫疗法的治疗目标对准那些将受益的人。人体免疫系统的一部分细胞毒性T细胞(红色)对口腔癌细胞产生攻击。图片由贝勒医学院NCI /邓肯综合癌症中心提供
近年来,利用人自身免疫系统对抗癌症的免疫疗法取得了革命性的成果,其中包括治愈以前无法手术的晚期疾病的人。如此出色的成功推动了其中一些药物成为治疗多种形式癌症的护理标准。但是,其中大多数仅对少数患者有效。在某些情况下,每100名患者中只有不到20名受益。
显然,改善免疫疗法的使用并从不成功(因此是不必要)的治疗中减少成本,在于更准确地预测哪些患者将从中受益。
马里兰大学计算机科学助理教授Mark(Max)Leiserson和Microsoft研究与纪念斯隆·凯特琳癌症中心的同事认为,更好地进行预测的方法在于一种新的计算机建模方法,该方法可以分析多个方面的数据患者和他们的癌症同时发生。在发表在《PLOS One》杂志上的一项最新研究中,Leiserson及其同事使用了膀胱癌患者临床试验的数据来证明,他们的方法可以识别出一系列特征,这些特征可以准确预测关键的免疫系统对治疗的反应,同时减少过度治疗减半
该论文的主要作者莱森森说:“如果您的目标是对待特定数据集中的每个人都会做出回应,那么我们在本文中展示的多因素建模类型将使您做到这一点,同时减少了更少的不会回应的人。”以及UMD计算机科学系的助理教授。Leiserson在新英格兰Microsoft Research担任博士后研究员时就开始进行这项研究,并继续为该公司提供咨询。
他说:“这项研究令人兴奋的是,我们不仅关注患者的预后,而且关注免疫应答的特定标志,这使我们对所发生的事情有了更好的了解。”
相比之下,Leiserson及其同事表明,他们对哪些患者将受益的多因素计算机模型预测可能包括多达38%的无益患者,而仍能捕获100%的患者。他们发现,关键是要包括三种不同类型的数据,这在癌症研究或治疗中目前还不是标准的数据。
尽管免疫疗法研究人员开始收集有关癌症患者及其对疗法的反应的更多信息,但重点仍然主要在于寻找一些关键标志物,这些标志物是成功的重要预测指标。但是,解决方案可能要复杂得多。对于所有患者而言,可能不仅有少数重要特征或标记,而且存在的特征或标记很可能以某种复杂的组合起作用。
“人们已经意识到预测反应越来越合适和需要,并且能够做到这一点,传统的单一生物标志物方法并不总是足够的,” Leiserson说。
为了生成他们的计算机模型,Leiserson和他的团队使用独特而丰富的数据集对来自临床试验的数据进行了分析,该数据集捕获了有关肿瘤细胞,免疫细胞的信息以及诸如人口统计和病史的患者信息。与许多研究一样,该试验旨在发现与对药物的特定反应相关的关键特征。认识到这种多模式数据集的潜力,研究人员发现了将机器学习应用于问题的机会。该研究论文Mark DM Leiserson,Vasilis Syrgkanis,Amy Gilson,Miroslav Dudik,Sharon Gillett,Jennifer Chayes,Christian Borgs,Dean F.Bajorin,Jonathan乔纳森说:“针对PD-L1抑制剂的T细胞扩增和持久临床获益的多因素模型” E. Rosenberg,Samuel Funt,Alexandra Snyder和Lester Mackey发表在他们的模型中。他们将36种不同的特征输入到他们的模型中,并允许计算机识别出可以预测治疗后患者血液中潜在的抗肿瘤免疫细胞增加的模式。(在研究的患者中,治疗后血液中T细胞的扩增与无进展生存期相关。)
最终的算法确定了20个特征,当一起分析时,可以解释患者免疫应答变化的79%。根据Leiserson的说法,这意味着为这些患者收集的异常全面的特征集足以准确预测患者的免疫反应。
更重要的是,他们发现,如果从模型中消除了三类数据中的任何一种(肿瘤数据,免疫细胞数据或患者临床数据),则免疫反应将不再可预测-他们的模型最多只能预测23%的变化。Leiserson强调,重要的不一定是20个特征,而是对多因素方法的依赖。
他说:“我们确定的这些特征可能不是唯一可以用来预测患者反应的特征。” “您可能会用其他方法替代它们,但这是关于方法以及所有三类功能的纳入。”
Leiserson认为这项工作与当前在精确肿瘤学方面的努力是自然平行的,后者旨在针对个别患者肿瘤的遗传学和分子特征量身定制治疗方法。
他说:“我们正在通过查看患者的分子特征和临床病史来预测他们将要发生的情况。” “这是建立对肿瘤分子结构的了解,它提供了除肿瘤所在的组织或在显微镜下的肿瘤外观之外的其他信息。”
科学家开发的模型尚未准备好用作诊断工具,因为它仅合并了21位患者的数据,对于一般人群而言,该数据太少了,无法预测。Leiserson说,他们希望随着更多数据的加入而将患者添加到模型中。他希望这项研究的成功将鼓励医院和其他研究人员将时间和精力投入到收集比传统方法更多的信息上。
“这项工作的目标之一是提出一个问题,'医院应该优先收集此类数据吗?'” “现在我们可以说,这种多因素方法使我们可以更好地预测对这些免疫疗法的反应。我希望这能激发继续收集这些数据的努力和支出。”