病毒,特别是RNA病毒,如新冠病毒,通过积累新的突变不断进化。其中一些突变对病毒更有利,能够帮助变异体逃避宿主免疫系统并迅速传播。从理论上讲,如果科学家能够预测病毒未来的进化路径,就可以提前设计疫苗和抗病毒疗法。
目前,人工智能(AI)工具能够预测哪些单一突变会使病毒更具优势,以及哪些变异体可能在短期内占据主导地位。然而,这些工具尚无法预测长期内病毒可能经历的复杂突变组合。
过去,研究人员通过实验室实验识别出具有增强特性的病毒变体,但这些实验耗时且费力。近年来,AI驱动的蛋白质结构预测工具为这一领域注入了新动力。例如,DeepMind开发的AlphaFold和Meta推出的ESM-2以及ESMFold,都展现了技术突破。
AI模型需要大量数据才能实现病毒进化预测。得益于新冠疫情期间的广泛基因测序,研究人员目前拥有近1700万个基因序列作为训练数据。
尽管如此,免疫学家指出,要显著提高AI模型的预测能力,可能需要超过五年的病毒进化数据。此外,目前的大多数AI模型仍主要关注单一突变的影响,而病毒的进化空间几乎是无限的。例如,当奥密克戎变种出现时,它携带了50多个突变,其中许多是研究人员此前未曾预料到的。