生物学家利用18亿个遗传密码字母构建出突破性的开花植物生命树

摘要:

由包括密歇根大学三名生物学家在内的 279 名科学家组成的国际团队最近在《自然》杂志上发表的一项研究,提供了有关开花植物生命树的最新见解。这项成果使用了来自 9500 多个物种的 18 亿个遗传密码,涵盖近 8000 个已知有花植物属(约占 60%),为有花植物的进化史及其在地球上崛起为生态主导提供了新的视角。

在邱园皇家植物园科学家的领导下,研究小组相信这些数据将有助于今后识别新物种、完善植物分类、发现新的药用化合物,以及在气候变化和生物多样性丧失的情况下保护植物。

这项植物科学领域的重大里程碑研究涉及 138 个国际组织,其所依据的数据量是对有花植物生命树进行的同类研究的 15 倍。在为这项研究进行测序的物种中,有 800 多个物种的DNA以前从未被测序过。

这项研究揭示的数据量之大,需要一台计算机花费 18 年的时间才能处理完毕,这是邱园"生命之树计划"在为所有 33 万种已知有花植物建立生命之树方面迈出的一大步。

"分析这一前所未有的数据量,解码隐藏在数百万 DNA 序列中的信息,是一项巨大的挑战。但这也为我们重新评估和扩展对植物生命树的认识提供了一个独特的机会,为探索植物进化的复杂性打开了一扇新窗口,"邱园皇家植物园研究员亚历山大-尊蒂尼(Alexandre Zuntini)说。

马萨诸塞大学进化生物学家斯蒂芬-史密斯(Stephen Smith)实验室的博士后研究员汤姆-卡鲁瑟(Tom Carruthers)是这项研究的共同第一作者,他与尊蒂尼曾在邱园共事。马萨诸塞大学植物系统学家理查德-拉贝勒(Richard Rabeler)是该研究的共同作者。

Anigiosperm-Tree-of-Life-scaled(1).jpg

被子植物生命之树。资料来源:RBG Kew

"每当我们走进森林,开花植物都会为我们提供食物、衣物和问候。一个多世纪以来,构建开花植物生命树一直是进化生物学领域的重大挑战和目标,"这项研究的共同作者、麻省理工大学生态学与进化生物学系教授史密斯说。"这个项目为大多数有花植物属提供了一个庞大的数据集,为完成这一目标提供了一种策略,从而使我们离这一目标更近了一步。"

史密斯在该项目中扮演了两个角色。首先,他的实验室成员--包括麻省理工大学前研究生德鲁-拉尔森(Drew Larson)--前往邱园,帮助对一个名为"Ericales"的大型多样性植物群的成员进行测序,该植物群包括蓝莓、茶、杜鹃花、杜鹃花和巴西坚果。

其次,史密斯与邱园皇家植物园的威廉-贝克(William Baker)和费利克斯-弗雷斯特(Felix Forest)以及奥胡斯大学的沃尔夫-艾森哈特(Wolf Eisenhardt)共同监督了项目数据集的分析和构建。

"研究小组面临的最大挑战之一是许多基因区域所蕴含的意想不到的复杂性,在这些区域中,不同的基因讲述着不同的进化史。团队面临的最大挑战之一是许多基因区域所蕴含的意想不到的复杂性,不同的基因讲述着不同的进化历史。我们必须开发出一种程序,以前所未有的规模来研究这些模式。"

作为这项研究的共同负责人,卡鲁瑟的主要职责包括利用 200 块化石将进化树按时间进行缩放,分析整体进化树基础基因的不同进化史,以及估算不同开花植物系在不同时期的多样化率。

卡鲁瑟说:"基于如此多的基因,为有花植物构建如此庞大的生命树,揭示了这一特殊群体的进化史,帮助我们了解它们是如何成为世界上如此不可或缺的主要组成部分的。所展示的进化关系--以及这些关系所依据的数据--将为今后的大量研究奠定重要基础。"

开花植物的生命树就像我们的家谱一样,能让我们了解不同物种之间的关系。生命树是通过比较不同物种之间的 DNA 序列来发现变化(突变)的,这些变化随着时间的推移不断累积,就像分子化石记录一样。

随着 DNA 测序技术的进步,我们对生命之树的了解也在迅速加深。在这项研究中,我们开发了新的基因组技术,通过磁力从每个样本中捕捉数百个基因和数十万个遗传密码,比早期的方法多出几个数量级。

Arenaria-globilfora.jpg

Arenaria globilfora.资料来源:RBG Kew

该研究小组的方法的一个主要优势是,它能对多种多样的新老植物材料进行测序,即使DNA受到严重破坏也不例外。世界标本馆收藏了近 4 亿份植物科学标本,其中有大量的干燥植物材料,现在可以对它们进行基因研究了。

邱园生命之树计划的高级研究负责人贝克说:"从很多方面来说,这种新颖的方法使我们能够与过去的植物学家合作,利用历史标本馆标本中的大量数据,其中一些标本早在19世纪初就被收集起来了。我们杰出的前辈,如查尔斯-达尔文或约瑟夫-胡克,不可能预料到这些标本在今天的基因组研究中会如此重要。在他们的有生之年,DNA 甚至还没有被发现。我们的工作表明,这些令人难以置信的植物博物馆对于地球生命的开创性研究有多么重要。谁知道其中还蕴藏着哪些未被发现的科学机遇呢?"

在所有 9506 个测序物种中,有 3 400 多个来自 48 个国家 163 个标本馆的材料。

马萨诸塞大学名誉研究科学家、马萨诸塞大学标本馆前馆长拉贝勒说:"为研究植物关系而对标本馆标本进行采样,使得从世界不同地区进行广泛采样的可行性大大提高,而不需要长途跋涉从野外获取新鲜材料。"

在生命之树项目中,拉贝勒帮助核实了标本馆采样标本的身份,并对所得数据进行了分析。仅开花植物就占陆地上所有已知植物生命的 90%,几乎遍布地球的每一个角落--从最湿润的热带到南极半岛的岩石露头。然而,我们对这些植物是如何在起源后不久就占据了主导地位的理解,却困惑了包括达尔文在内的几代科学家。

开花植物起源于 1.4 亿多年前,之后迅速取代了其他维管植物,包括它们的近亲--裸子植物(有裸露种子的非开花植物,如苏铁、针叶树和银杏)。

达尔文对化石记录中看似突然出现的这种多样性感到神秘。在 1879 年写给他的密友、邱园皇家植物园园长胡克的信中,他写道:"据我们判断,所有高等植物都是在最近的地质年代迅速发展起来的,这是一个令人憎恶的谜。"

作者利用 200 块化石,将他们的生命树按时间顺序排列,揭示了开花植物是如何跨越地质年代进化的。他们发现,早期有花植物的多样性确实出现了爆炸性增长,在其起源后不久就产生了今天存在的80%以上的主要品系。

然而,在接下来的 1 亿年里,这一趋势逐渐趋于平稳,直到大约 4000 万年前,随着全球气温的下降,物种多样性再次激增。这些新的洞察力会让达尔文着迷,也必将帮助今天的科学家们努力应对了解物种如何以及为什么会多样化的挑战。

如果没有邱园科学家与全球众多合作伙伴的通力合作,就不可能形成如此庞大的生命之树。总共有 279 位作者参与了这项研究,他们来自 27 个国家的 138 个组织,代表着不同的国籍。

"植物界长期以来一直在合作和协调分子测序工作,以生成更全面、更强大的植物生命树。"马萨诸塞大学的史密斯说:"发表这篇论文的努力延续了这一传统,但规模却大大扩大了。"

开花植物生命树在生物多样性研究方面具有巨大潜力。这是因为,正如人们可以根据元素在元素周期表中的位置来预测其特性一样,我们也可以根据物种在生命树中的位置来预测其特性。因此,这些新数据对于促进科学及其他许多领域的发展将是非常宝贵的。

为实现这一目标,生命之树及其基础数据已通过邱园生命之树资源管理器(KewTree of Life Explorer)等渠道向公众和科学界公开和免费开放。开放访问将有助于科学家充分利用这些数据,例如将其与人工智能相结合,预测哪些植物物种可能含有具有药用潜力的分子。同样,生命之树也可用于更好地了解和预测病虫害在未来将如何影响植物。作者指出,这些数据的应用最终将取决于获取数据的科学家的聪明才智。

编译来源:ScitechDaily

查看评论
created by ceallan