距今93万年前,人类祖先可能遭遇剧烈气候变化,在短期内丧失了约98.7%的成员个体,几乎灭绝。9月1日,国际学术期刊《科学》在线发表了中国科学院上海营养与健康研究所李海鹏研究组与华东师范大学脑功能基因组学研究所潘逸萱研究组的这项最新研究成果。
该研究创建了FitCoal(快速极小时间溯祖)新理论,并发现人类在早、中更新世过渡期由于气候环境的急剧变化经历了严重的群体瓶颈,人类祖先近乎灭绝。这一人类进化史上的重大发现,凝聚着合作研究团队“十年磨一剑”的结晶。
研究成果照片。图片左侧展示了群体历史估计新方法的核心公式;右侧岩画描绘了人类祖先在远古的群体瓶颈时期,团结起来共同面对未知的风险。中国科学院上海营养与健康研究所供图
对古人类群体进行“人口普查”
“如果说古DNA提取和分析是一把枪,精准击中了人类近十万年的溯祖研究,那么我们就想造一把新枪,用以解决百万年精准溯祖的问题。”李海鹏说。2007年,李海鹏成立研究组,希望破解这个人类群体进化史上的重大谜团。
“史前人口数量的变化,综合反映了该时期气候环境的变迁,所以通过群体遗传学的研究方法进行回溯,能更深入了解现代人类的形成。”他解释说。
已有化石记录表明,最近100万年是人类进化的关键时期,但人类群体历史的研究多局限于最近的30万-10万年。虽然近年来古DNA测序技术迅猛发展,但由于炎热条件不利于DNA的保存,无法从30万年前非洲人类祖先化石中提取古DNA。
为准确估算百万年前人类群体历史,研究团队创建了群体遗传学和计算生物学新理论——FitCoal。遵循这一理论,研究团队设定群体历史模型并分析模拟产生的DNA多态数据,精准追溯人类祖先历史的年限从距今10万年向前延伸到了100万年,甚至当数据充足,能精确追溯到每一天,置信区间高达95%。而且,输入任何生物的一段DNA数据,FitCoal都能给出溯祖结果。
史前虽无文字记载群体数量,但有效群体大小会影响每个世代的溯祖率,即两个谱系在上一世代来自同一祖先的概率。因此人类祖先曾在群体基因组中留下印记,反映当时的群体大小。群体历史越久远,留存至今的印记信号越微弱。
为准确解读人类祖先留下来的印记信号,研究团队遵循FitCoal理论进行数学推导,获得了在任意群体模型下各突变类型(即突变频谱)对应溯祖树枝长期望值的解析解,并获得精确的似然值,即在群体历史条件下观察到样本突变频谱的概率。因此,无须事先获得群体历史的先验知识,FitCoal即可自动快速搜寻出极大似然值,从而估算群体历史,对古人类群体进行“人口普查”。
从十万人锐减至千余人,人类祖先几近灭绝
基于FitCoal,研究团队进一步分析了来自千人基因组计划和HGDP-CEPH基因组计划(人类基因组多样性计划)产生的、共50个现代人类群体的基因组数据,首次发现在距今93.0万年前,人类祖先由于早、中更新世过渡期的气候剧烈变化,在短期内丧失了约98.7%的成员个体,个体数从近10万急剧下降到1280。
“这段空缺一直持续了11.7万年,此后人类祖先种群数量上升至27160。”李海鹏说,面对这一几近灭绝的群体瓶颈,人类祖先一定发生了某些改变,最终适应了气候变化,“此后再没有发现类似的情况。”既往考古学研究显示,人类约在79万年前学会控制火,或许是这一划时代的技能习得,使人类祖先绝地逢生。
此外,研究人员采用HGDP-CEPH数据集的两个南部非洲群体作了进一步验证,虽然样本量仅为6个和8个个体,但FitCoal依然检测到了远古群体瓶颈。研究发现,这一严重的远古群体瓶颈,恰好与非洲人类祖先化石的缺失环节、非洲直立人化石的消失、新的古人类物种的形成、两条古人类2号染色体的融合阶段相对应。
“这一远古时期群体数量的衰减,降低了65.85%现代人群的遗传多样性,对人类生命和健康产生深远的影响,很可能决定了现代人类许多关键表型的形成。”李海鹏表示。
业内专家表示,该成果的重大贡献是提出了理论框架——基于基因变异频谱的倒溯。美国南佛罗里达大学教授刘晓明点评称,FitCoal是“目前为止最为准确的估计有效群体规模历史的方法”。作为一种全新工具,FitCoal基于的是突变频谱数据,具有数据形式适应性强、计算速度快等优点,有广泛的应用前景。
在李海鹏看来,该成果将有诸多“溢出效应”。“这一成果可运用于动物、植物、微生物在内的多个物种的历史生存状况推溯,并且也有助于揭示肿瘤的演化、脑容量快速增长的分子机制以及现代人群对糖尿病的整体易感性。”李海鹏说。
“我们已锁定一个可能与人类糖尿病易感性相关的基因,后续将进一步深入研究。”潘逸萱表示,如果在这方面有所突破,可能会寻找到一些新途径,从人群总体上降低罹患糖尿病的风险。