DeepMind今日发布并开源其最先进AI蛋白质预测工具AlphaFold3程序代码
“迟来总比没有好”!Google DeepMind今日向充满期待的学术界公开了其最新人工智能蛋白质预测软件的源代码。尽管部分科学家对DeepMind耗费六个月时间才公布代码表示不满,但绝大多数科研人员对此表示欢迎。
5月8日,DeepMind在《自然》杂志上发表文章,宣布推出了AlphaFold3,该技术不仅能够预测蛋白质结构,还能预测其与DNA、RNA和其他蛋白质的相互作用,这对于药物发现等领域具有重大意义。
然而,他们对技术的发布方式提出了批评:尽管《自然》杂志的编辑指南要求发表的研究必须提供计算代码,但该论文仅提供了“伪代码”——即程序运行步骤的描述——以及一个每天只允许有限次数预测的在线门户链接。这与DeepMind在2021年《自然》杂志上发表的提供完整代码的AlphaFold2形成了鲜明对比,违背了公认的开放性、可重复性和同行评审的标准。在一封获得数百人签名支持的公开信中,研究人员明确指出了这一点。
面对抵制,DeepMind承诺在论文发表后六个月内向非商业用户公开全部代码。如今,它履行了这一承诺。
该计算模型已在代码存储库GitHub上以非商业许可证的形式公开发布,而用于调整AI模型的“权重”(数值)也可供完成简短申请表的学者使用。
DeepMind科学副总裁Pushmeet Kohli表示:“我们感谢社区的耐心等候。”尽管他和他的团队坚信他们发布的程序是正确的,但Kohli承认社区希望直接使用代码。他补充说,为了今天的公开发布,他们花费了数月时间准备和测试模型。
对此,研究人员表示欢迎。斯德哥尔摩大学的生物物理学家埃里克·林达尔,也是公开信的签署人之一,表示:“我很高兴看到DeepMind团队履行承诺,公开代码,这意味着对一篇重要论文的深入审查终于可以开始了。”范德堡大学的计算结构生物学家斯蒂芬妮·万科维兹,公开信的组织者之一,补充说:“所发布的模型和权重对于评估和在此基础上进一步研究都具有重要意义。”但她同时指出,“六个月的延迟是不可接受的。”
AlphaFold3是最新的AlphaFold版本,它是一种基于氨基酸序列的蛋白质结构预测AI,今年早些时候,它凭借这一技术为DeepMind的两位研究员约翰·朱默和德米斯·哈萨比斯赢得了诺贝尔化学奖的提名。然而,直到今天,研究人员只能通过DeepMind的在线门户使用该程序,每天仅限10个(现为20个)请求,且只能处理有限的分子集合。
《自然》杂志主编玛格达莱娜·斯基珀在今年5月的声明中没有具体说明为何放弃了分享完整代码的要求,但她提到编辑们考虑了“生物安全的潜在影响以及由此带来的伦理挑战”。同时,《自然》杂志的一篇新闻报道引用科赫的话称,团队限制了AlphaFold3的访问权限,以避免影响DeepMind的商业子公司Isomorphic Labs的药物研发计划。科利向《科学》杂志透露,DeepMind团队优先开发了这个门户,而不是发布代码,“以确保我们为最多的人提供了最简单的界面。”朱默表示,通过这个门户,研究人员已经完成了一些“令人难以置信的工作”,而这一工作在今天的新闻发布后并未改变。他怀疑大多数科学家将继续以这种方式工作,因为这对那些计算能力有限的团队来说更为实用。
DeepMind的研究人员还反驳了一些批评者的说法,称《自然》杂志上的论文是可以重复的,因为有多个团队已经基于伪代码开发了自己的AlphaFold3版本。百度、Ligo Biosciences和Chai Discovery等专注于AI的公司已经发布了这些努力的结果。伦敦大学学院的生物信息学研究员丹尼尔·布坎指出,这些替代“实现”方案在AlphaFold 3的代码现已公开的情况下,仍可能很有用。“能够重现方法是件好事,也是很重要的,”他说。万科维兹补充称,比较和对比这些模型可能会在未来带来改进。研究人员表示,尤其重要的是那些不受限制的用户许可证的实施方案,比如非营利组织OpenFold联盟正在开发的方案。否则,“如果我帮助一位同事设计出一种可能成为潜在抗癌药物的全新配体,而某天他们想与制药公司合作将其商业化,事情就会变得非常复杂,”福克斯蔡斯癌症中心的计算结构生物学家罗兰·邓布拉克说。他最初被要求为《自然》杂志审阅DeepMind的手稿,但从未收到代码以进行审阅。已经有一些研究团队计划与AlphaFold3的代码合作。
今天发表在《自然计算科学》杂志上的一篇论文的作者表示,他们希望将AlphaFold3整合到自己的软件中。这款名为MassiveFold的程序可以帮助用户利用并行计算来缩短在AlphaFold2上运行大量预测所需的时间——从数月缩短至数小时。
法国国家科研中心的生物信息学研究员、MassiveFold开发者Guillaume Brysbaert表示,通过整合DeepMind的新代码,“用户可以从AlphaFold2或AlphaFold3中获得最佳预测结果”。朱默说,DeepMind团队期待着今天公开发布的成果。“在AlphaFold2中,我们看到了很多创造力,”他说。“我真的很兴奋地想看看社区会发现AlphaFold3是如何工作的——它如何应用于新的问题?”