研究人员对3.175亿个海洋微生物的基因信息进行了分析和编目
研究人员发现了属于海洋微生物的 3.17 亿个独特基因簇。该库也是世界上最大的开源基因目录,但也仅代表了海洋元基因组学的"冰山一角",为探索如何将这些基因资源用于医药、能源、食品和其他行业提供了工具。
海洋微生物组是一个巨大的、高度多样化的基因库,具有复杂的新陈代谢能力。全球海洋基因组已被证明是科学的重要资源,尤其是在健康领域。例如,最初从水母中分离出来的绿色荧光蛋白现在已被广泛应用于医学成像诊断;生活在热液喷口周围的细菌是用于检测 SARS-CoV-2 的 PCR 测试中聚合酶的来源。但是,还有更多的基因有待发现。
元基因组学是对直接取自环境或临床样本的遗传物质的研究,可以将基因功能与基因所属的生物体相匹配。分析数百万海洋微生物的基因构成是一项艰巨的任务。值得庆幸的是,人工智能的兴起和计算能力的提高使得大规模的元基因组分析成为可能。
现在,阿卜杜拉国王科技大学(KAUST)的研究人员与西班牙国家研究委员会(CSIC)海洋科学研究所合作,对居住在海洋中的微生物的大量基因信息进行了分析和编目。
研究人员利用 2021 年发明的 KAUST 元基因组分析平台 (KMAP) 分析了 2102 份海洋样本。大部分(78.5%)样本采集于上层海洋(0 至 200 米/656 英尺);7.2%采集于中层海洋(200 米/656 英尺至 1000 米/3281 英尺);10.2%采集于暗层海洋,深度低于 1000 米/3281 英尺。
他们的DNA测序分析确定了3.175亿个独特的基因簇,并利用这些基因簇创建了KMAP全球海洋基因目录1.0,这是世界上最大的海洋微生物开源目录,可将微生物与基因功能、地理位置和栖息地类型相匹配。除了增进我们对海洋微生物群及其新陈代谢能力的了解外,所提供的信息还能帮助科学家追踪全球变暖、污染和整体海洋健康状况,并为探索新型基因在医药、能源、食品和其他行业的潜在用途提供了工具。
该研究的通讯作者卡洛斯-杜阿尔特(Carlos Duarte)说:"科学家可以远程访问目录,研究不同的海洋生态系统是如何运作的,跟踪污染和全球变暖的影响,寻找生物技术应用,如新型抗生素或分解塑料的新方法。我们目前正在经历的人工智能加速发展很可能会在识别我们正在发布的海量目录中所包含的生物技术相关基因方面发挥重要作用"。
有趣的是,在中深海区发现的独特基因簇中,真菌占了 50%以上,这凸显了真菌对微生物多样性的贡献。此外,95.9% 的样本来自远洋区,即远离海岸的开放自由水域,4.1% 的样本来自海底区,即洋底。底栖微生物在海洋生物地球化学循环中起着举足轻重的作用,生物圈中生物(生物)和非生物(非生物)之间的相互作用促进了碳、氮和硫等重要元素的更替。收集有关这些微生物的信息为了解海洋生态系统如何适应因自然和人为原因而不断变化的环境提供了宝贵的信息。
"我们的分析强调了继续对海洋进行采样的必要性,重点是那些研究不足的区域,如深海和洋底,"该研究的主要作者Elisa Liaolo说。
虽然 3.175 亿个基因簇听起来似乎很多,但研究人员知道,他们仍有很多工作要做。
杜阿尔特说:"海洋基因目录1.0中记录的3.17亿个基因组虽然令人印象深刻,但很可能只是海洋生命漫长进化史所积累的庞大功能库的冰山一角。进一步的项目侧重于对海洋中未被充分研究的栖息地进行取样和大规模测序,其中包括研究中未包括的珊瑚和海草等生物,这些栖息地中已知有大量微生物物种,这些项目将可能揭示出比这个初始基因目录中包含的基因数量多得多的基因。"
这项研究发表在《科学前沿》杂志上。