近日,上海交通大学生命科学技术学院微生物代谢国家重点实验室欧竑宇研究组联合澳大利亚蒙纳士大学宋江宁研究组等多个研究组于Nature子刊Nature Machine Intelligence发表题为“Epitope-anchored contrastive transfer learning for paired CD8+ T cell receptor-antigen recognition”的研究论文。该研究采用迁移学习与对比学习,成功开发了一种预测CD8+ T 细胞受体识别抗原表位的新方法。生命科学技术学院2021级硕士毕业生张昱朦为第一作者,欧竑宇教授和宋江宁教授为共同通讯作者。
CD8+ T 细胞在对抗病原体感染、癌症和自身免疫疾病中发挥着关键作用:细胞表面的T细胞受体(TCR)通过识别主要组织相容性复合体(MHC)I类分子呈递的抗原表位来激活T细胞,引发适应性免疫反应。准确和高通量地识别与特定抗原表位结合的TCR能够帮助理解T细胞免疫反应的机制,支持开发基于TCR的免疫疗法。尽管单细胞TCR测序技术和四聚体相关TCR测序(TetTCR-seq)等能够产出配对的TCR转录本及其抗原识别的特异性,但这些实验方法仍存在成本高、技术复杂和表位覆盖度有限等问题。因此,研究人员开发了一系列深度学习方法,通过对TCR和抗原表位-MHC复合物(pMHC)的序列建模,旨在预测两者间的结合特异性。然而,现有方法大多仅关注TCRβ链上的互补决定区3(CDR3),且在预测新生抗原(neoantigen)或不常见的抗原表位时效果不佳。
这项研究提出一种新的深度学习方法EPACT,利用在大规模TCR序列和抗原肽-MHC结合数据上的预训练,通过迁移学习有效提升了TCR和pMHC间结合特异性的预测表现。EPACT被成功应用于分析SARS-CoV-2感染和疫苗接种前后的TCR克隆类型(clonotype),不仅能够鉴定抗原特异的TCR簇,还佐证了不同感染和疫苗接种状态下刺突蛋白(spike)特异和非刺突蛋白(non-spike)特异的免疫反应的差异。EPACT在TCR-pMHC复合物的三维结构数据上微调后,能够准确识别CDR和抗原表位间的结合热点,进而帮助解析T细胞的交叉反应性(cross-reactivity)。随着高质量的TCR结合特异性数据和TCR-pMHC复合物结构的持续发布,EPACT有望被进一步开发成为一种实用的计算工具,以加速在临床研究中对基于TCR的免疫疗法和疫苗的评估。
图1. CD8+ T 细胞受体识别抗原表位预测方法EPACT的模型框架和应用场景
论文链接:
https://www.nature.com/articles/s42256-024-00913-8