约翰霍普金斯大学的一个工程师和癌症研究人员团队开发出了一种深度学习技术,能够准确预测与癌症有关的蛋白质片段,这些片段可能会触发免疫系统的反应。如果这项技术在临床测试中证明是成功的,那么它就能解决在创造个性化免疫疗法和疫苗方面的一个重大挑战。
细胞毒性 CD8+ T 细胞通过受体结合新抗原识别癌细胞。图片来源:OpenAI 的 DALL-E 2 生成的图像
在7月20日发表在《自然-机器智能》(Nature Machine Intelligence)杂志上的一项研究中,来自约翰霍普金斯大学生物医学工程系、约翰霍普金斯大学计算医学研究所、约翰霍普金斯大学金梅尔癌症中心和布隆伯格~金梅尔癌症免疫疗法研究所的研究人员表明,他们的深度学习方法(名为BigMHC)可以识别癌细胞上能引起肿瘤细胞杀伤性免疫反应的蛋白质片段,这是了解免疫疗法反应和开发个性化癌症疗法的重要一步。
"癌症免疫疗法旨在激活患者的免疫系统来消灭癌细胞,"生物医学工程、肿瘤学和计算机科学教授、计算医学研究所核心成员雷切尔-卡钦(Rachel Karchin)博士说。"这一过程的关键步骤是免疫系统通过T细胞与细胞表面的癌症特异性蛋白片段结合来识别癌细胞。"
引起这种肿瘤杀伤性免疫反应的癌症蛋白片段可能源自癌细胞基因构成的变化(或突变),称为突变相关新抗原。每个患者的肿瘤都有一组独特的此类新抗原,这些新抗原决定了肿瘤的异质性,换句话说,决定了肿瘤构成与自身的不同程度。科学家可以通过分析癌症基因组来确定患者肿瘤具有哪些与突变相关的新抗原。确定哪些新抗原最有可能触发杀死肿瘤的免疫反应,科学家就能开发出个性化的癌症疫苗或定制的免疫疗法,并为患者选择这些疗法提供依据。然而,目前鉴定和验证触发免疫反应的新抗原的方法耗时费钱,因为这些方法通常依赖于劳动密集型的湿实验室实验。
由于新抗原验证需要大量资源,因此可用于训练深度学习模型的数据很少。为了解决这个问题,研究人员通过一个称为迁移学习的两阶段过程训练了一组深度神经网络 BigMHC。首先,BigMHC 学习识别呈现在细胞表面的抗原,这是适应性免疫反应的早期阶段,可以获得许多相关数据。然后,BigMHC 通过学习后期阶段(T 细胞识别)进行微调,而这一阶段的数据很少。通过这种方式,研究人员利用海量数据建立了一个抗原呈递模型,并对该模型进行了改进,以预测免疫原性抗原。
研究人员在一个大型独立数据集上对 BigMHC 进行了测试,结果表明它在预测抗原呈递方面优于其他方法。他们还对研究共同作者、布隆伯格~金梅尔癌症免疫疗法研究所(Bloomberg~Kimmel Institute for Cancer Immunotherapy)肿瘤学副教授凯莉-史密斯(Kellie Smith)博士的数据对BigMHC进行了进一步测试,发现BigMCH在识别可触发T细胞反应的新抗原方面明显优于其他七种方法。"BigMHC在预测免疫原性新抗原方面具有出色的精确性,"Karchin说。
"为最有可能获益的患者子集量身定制癌症免疫疗法是一项迫切的、尚未得到满足的临床需求,BigMHC 可以揭示驱动肿瘤异质性的癌症特征,从而触发有效的抗肿瘤免疫反应。"该研究的共同作者、胸部肿瘤学生物库主任、约翰霍普金斯大学分子肿瘤委员会和精准肿瘤学分析领导者、金梅尔癌症中心肿瘤学副教授 Valsamo"Elsa"Anagnostou 博士说。
该团队目前正在扩大工作范围,在几项免疫疗法临床试验中测试BigMHC,以确定它是否能帮助科学家从成千上万的新抗原中筛选出最有可能引起免疫反应的抗原。
这项研究的第一作者本杰明-亚历山大-阿尔伯特(Benjamin Alexander Albert)说:"我们希望BigMHC能为癌症免疫学家提供指导,帮助他们开发可用于多名患者的免疫疗法,或开发可增强患者免疫反应以杀死癌细胞的个性化疫苗。阿尔伯特现在是加州大学圣迭戈分校的一名博士生。"
Karchin和她的团队相信,BigMHC 和类似的基于机器学习的工具可以帮助临床医生和癌症研究人员高效、低成本地筛选大量数据,从而开发出更加个性化的癌症治疗方法。Karchin说:"深度学习在临床癌症研究和实践中发挥着重要作用。"