一个开创性的项目绘制了超过9500种开花植物的DNA图谱
开花植物的生命树就像我们的家谱一样,让我们了解不同物种之间的关系。生命之树是通过比较不同物种之间的DNA序列来确定变化(突变)的,这些变化随着时间的推移不断累积,就像分子化石记录一样。由于 DNA 测序技术的进步,我们对生命树的了解正在迅速加深。
来自英国皇家植物园邱园的科学家与中国科学院昆明植物研究所(KIB)以及全球各地的合作者最近共同完成了一项庞大的 DNA 生命树研究,公开了 9500 多种有花植物的 DNA 序列,这一宝贵的资源让我们能够回答有关现代植物生命的关键问题,并回溯其起源。他们的研究最近发表在《自然》杂志上。
这种方法的一个主要优点是,它可以用于对各种新旧植物材料进行测序,即使是在 DNA 受到严重破坏的情况下。世界标本馆收藏的大量干燥植物材料,包括近 4 亿份科学植物标本,现在都可以进行基因研究。
被子植物生命之树。资料来源:RBG Kew
利用这些标本,研究人员对近 200 年前在尼泊尔采集的沙草标本(Arenaria globiflora)进行了测序,尽管其 DNA 质量很差,但还是将其放入了生命树中。他们甚至分析了已经灭绝的植物,例如Hesperelaea palmeri,这种植物自 1875 年以来就没有活体出现过。事实上,根据《国际自然保护联盟红色名录》,被测序的物种中有 511 种已经濒临灭绝,其中还有三种像Hesperelaea一样已经灭绝。
本研究测序的 9506 个物种中,有 3400 多个来自 48 个国家 163 个标本馆的材料,其他材料来自世界各地的植物收藏(如 DNA 库、种子和活体收藏)。
在被测序的物种中,有 800 多个物种的 DNA 以前从未被测序过。这种测序对于填补重要的知识空白和揭示开花植物的进化史至关重要。研究人员还得益于 1900 多个物种的公开数据,凸显了开放科学方法对未来基因组研究的价值。
尽管核基因组和质粒基因组的生物特性(如大小、拷贝数、遗传方式、重组和进化速度)截然不同,可能导致系统发生树相互矛盾,但研究结果在很大程度上支持了被子植物系统发生第四组主要基于质粒的系统发生分类。例如,64 个目前公认的目中有 58 个和 416 个科中有 406 个被恢复为单系(不包括人工制品)。
本作品(左)与 APG IV 图示树(右)之间的序级切分图。资料来源:KIB
最显著的例外是菊科(最大的被子植物科,包括向日葵及其近缘植物)的非单系性。这项研究生成的系统树还证实了 KIB 科学家利用质粒进行的被子植物系统树所发现的 85% 的科间关系。
开花植物起源于 1.4 亿多年前,之后迅速取代了其他维管植物。达尔文对化石记录中似乎突然出现的这种多样性感到困惑,他写道:"据我们判断,所有高等植物都是在最近的地质年代中迅速发展起来的,这是一个令人憎恶的谜"。
研究人员利用 200 块化石,追溯生命之树的历史,展示开花植物在地质年代中的进化过程。他们发现,正如达尔文所指出的那样,早期的开花植物确实呈现出爆炸性的多样性。这些植物在起源后不久就迅速发展,形成了今天主要品系中的 80% 以上。然而,在接下来的 1 亿年里,这一趋势逐渐趋于稳定,直到大约 4000 万年前,随着全球气温的下降,植物的多样性再次激增。
这些新发现会让达尔文着迷,也必将帮助今天的科学家应对挑战,了解物种如何以及为什么会多样化。
开花植物生命树在生物多样性研究方面潜力巨大。这是因为,正如人们可以根据元素在元素周期表中的位置来预测其特性一样,我们也可以根据物种在生命树中的位置来预测其特性。因此,新数据对于改进科学及其他领域的许多工作都将是非常宝贵的。
为了实现这一目标,这棵树及其所有基础数据都通过邱园生命之树资源管理器(Kew Tree of Life Explorer)等渠道向公众和科学界公开和免费提供。研究人员认为,这种开放式访问是实现全球科学数据访问民主化的关键。
开放存取还有助于科学家充分利用这些数据,例如将其与人工智能相结合,预测哪些植物物种可能含有具有药用潜力的分子。同样,生命之树也可用于更好地了解和预测病虫害在未来将如何影响植物。研究人员指出,这些数据的应用最终将取决于获取这些数据的科学家的聪明才智。
编译来源:ScitechDaily