利用数据驱动方法,研究人员发现了分子结构中的"设计自由",这是由于量子力学特性中的弱相关性造成的。这一发现与机器学习相结合,可以彻底改变分子设计和药物发现。
理性分子设计过程的图形描述,该过程包括"大海捞针"式地寻找具有所需特性的分子。图片来源:卢森堡大学 Leonardo Medrano Sandonas;背景图片由 rawpixel.com 在 Freepik 上提供
利用数据驱动方法探索分子和材料的巨大空间,激发了无数学术界和工业界寻找分子结构特征与其物理化学特性之间存在的基本关系。虽然在这一领域取得了重大进展,但对这些复杂关系的全面理解仍然欠缺,即使是在小分子这一更易管理的化学与化学物质领域也是如此,尽管这些分子在整个化学和制药科学领域都至关重要,具有高度相关性。
卢森堡大学物理与材料科学系理论化学物理教授亚历山大-特卡琴科(Alexandre Tkatchenko)说:"揭示分子结构与性质之间的复杂关系,不仅能为我们提供探索和表征分子空间所需的工具,还能大大提高我们合理设计具有一系列目标理化性质的分子的能力。"
弱相关性带来"设计自由
在题为"化学化合物空间的'设计自由': 在著名的《化学科学》(Chemical Science)杂志上发表的题为《化学化合物空间中的"自由设计":实现具有目标量子力学性质的分子的合理硅学设计》(Towards Rational in Silico Design of Molecules with Targeted Quantum-Mechanical Properties)的论文中,一个重要发现是,小分子的大多数量子力学性质只是弱相关。
康奈尔大学理论化学教授小罗伯特-迪斯塔西奥(Robert DiStasio Jr.)说:"虽然人们最初可能会把这一发现视为对合理分子设计的挑战,但我们的分析凸显了 CCS 固有的灵活性,在 CCS 中,似乎很少有限制阻止分子同时表现出任何一对性质,或阻止许多分子共享一系列性质。"
在化学空间中寻找最佳途径
分子设计过程通常涉及多种物理化学性质的同时优化,为了探索这种内在灵活性在分子设计过程中将如何体现,作者们使用帕累托多性质优化法来寻找同时具有大分子极性和电子间隙的分子,这是一项与确定聚合物电池新型分子相关的设计任务。作者在化学空间中找到了几种意想不到的分子通过结构和/或组成变化连接起来的路径,这反映了合理设计和发现具有目标特性值的分子的自由度。
Tkatchenko教授解释说:"下一步可能很有趣的工作是将这些帕累托最优结构与强大的机器学习方法结合起来,建立可靠的多目标框架,以便对迄今尚未探索的化学空间进行系统导航。"
对分子设计范式的影响
"通过证明'设计自由'是CCS 的一个基本和新兴特性,我们的工作对合理分子设计和计算药物发现领域产生了一系列重要影响。首先,我们希望这项工作能对化学科学界提出挑战,让他们考虑如何利用这种内在的灵活性来扩展正向分子设计过程中的主流范式。"卢森堡大学理论化学物理组博士后研究员莱昂纳多-梅德拉诺-桑多纳斯(Leonardo Medrano Sandonas)博士解释说:"我们还希望这项工作能在解决反向分子设计问题方面取得实质性进展,在反向分子设计问题中,人们试图找到与一系列目标特性相对应的分子(或一组分子)。"
将从这项工作中获得的见解与先进的机器学习方法相结合,有助于开发针对特定应用的新型分子高通量筛选的有效策略,而这正是特卡特琴科教授研究小组的一个突出研究方向。