返回上一页  首页 | cnbeta报时: 16:33:38
MIT/哈佛的细胞重编程创新技术可找到有效的癌症克星和再生疗法
发布日期:2023-10-06 18:58:00  稿源:cnBeta.COM

麻省理工学院和哈佛大学的研究人员开发出了一种新颖的计算技术,可以利用更少的实验有效地确定细胞重编程的最佳基因干预。他们的独特方法利用了系统内的因果关系,为每一轮测试优先选择最有效的干预措施。

42256_2023_719_Fig1_HTML.png

在应用于真实生物数据时,他们的算法始终优于标准方法,为细胞重编程提供了更有效的途径,并有可能应用于其他领域。新的人工智能方法可以帮助科学家确定新的免疫疗法技术或再生疗法。

42256_2023_719_Fig4_HTML.png

细胞重编程策略包括使用有针对性的基因干预,将细胞工程改造成一种新的状态。这种技术在免疫疗法中大有可为,例如,研究人员可以对患者的 T 细胞进行重编程,使其成为更强大的癌症杀手。有朝一日,这种方法还能帮助确定拯救生命的癌症治疗方法或修复疾病摧残器官的再生疗法。

42256_2023_719_Fig2_HTML.png

然而,人体约有 2 万个基因,基因扰动可能发生在多个基因的组合上,也可能发生在调控基因的 1000 多个转录因子中的任何一个上。由于搜索空间巨大,而基因实验成本高昂,科学家们往往难以找到适合其特定应用的理想扰动。

42256_2023_719_Fig5_HTML.png

麻省理工学院和哈佛大学的计算创新

麻省理工学院和哈佛大学的研究人员开发了一种新的计算方法,与传统方法相比,这种方法只需进行数量少得多的实验,就能高效地确定最佳遗传扰动。

他们的算法技术利用基因组调控等复杂系统中各因素之间的因果关系,在每一轮连续实验中优先选择最佳干预措施。

研究人员进行了严格的理论分析,以确定他们的技术确实能找出最佳干预措施。有了这一理论框架,他们将算法应用于模拟细胞重编程实验的真实生物数据。他们的算法效率最高,效果最好。

Caroline-Uhler-777x518.webp

麻省理工学院和哈佛大学的研究人员开发了一种新的计算方法,与传统方法相比,这种方法可以根据数量少得多的实验有效地确定最佳遗传扰动。电子工程与计算机科学系(EECS)教授卡罗琳-乌勒(Caroline Uhler)是这篇论文的共同第一作者。图片来源:亚当-格兰兹曼

大规模实验往往是根据经验设计的。论文的共同第一作者卡罗琳-乌勒(Caroline Uhler)说:"一个谨慎的顺序实验因果框架可能会让我们用更少的试验确定最佳干预措施,从而降低实验成本,"她是电气工程与计算机科学系(EECS)教授,同时也是麻省理工学院和哈佛大学布罗德研究所埃里克和温迪-施密特中心(Eric and Wendy Schmidt Center)的共同主任,以及麻省理工学院信息与决策系统实验室(LIDS)和数据、系统与社会研究所(IDSS)的研究员。

该论文于10月2日发表在《自然-机器智能》(Nature Machine Intelligence)杂志上,与乌勒共同完成该论文的还有论文的第一作者、研究生张佳琪(Eric and Wendy Schmidt Center Fellow),共同第一作者、麻省理工学院机械与海洋工程系教授、IDSS成员Themistoklis P. Sapsis,以及哈佛大学和麻省理工学院的其他研究人员。

基因研究中的主动学习

当科学家试图为一个复杂的系统设计有效的干预措施时,比如在细胞重编程中,他们通常会按顺序进行实验。这种情况非常适合使用一种名为主动学习的机器学习方法。收集数据样本后,利用这些样本学习系统模型,该模型包含了迄今为止收集到的知识。根据这个模型,设计出一个获取函数--一个评估所有潜在干预措施并选出最佳干预措施在下一次试验中进行测试的等式。

这一过程不断重复,直到找到最佳干预措施(或用于资助后续试验的资源耗尽)为止。

萨普西斯解释说:"虽然有几种通用的获取函数可以按顺序设计实验,但这些函数对于如此复杂的问题并不有效,导致收敛速度非常缓慢。"

获取函数通常会考虑因素之间的相关性,例如哪些基因共同表达。然而,只关注相关性会忽略系统的调控关系或因果结构。例如,基因干预只能影响下游基因的表达,但基于相关性的方法无法区分上游或下游基因。

张解释说:"可以从数据中学到一些因果知识,并利用这些知识更有效地设计干预措施。"

麻省理工学院和哈佛大学的研究人员在他们的技术中利用了这种潜在的因果结构。首先,他们精心构建了一种算法,使其只能学习说明因果关系的系统模型。然后,研究人员设计了获取功能,使其能够利用这些因果关系信息自动评估干预措施。他们精心设计了这一功能,使其优先考虑信息量最大的干预措施,即那些最有可能在后续实验中产生最佳干预措施的措施。

"通过考虑因果模型而不是基于相关性的模型,我们已经可以排除某些干预措施。然后,每当获得新数据时,就可以学习更准确的因果模型,从而进一步缩小干预空间,"Uhler 解释说。

这种更小的搜索空间,加上获取函数特别关注信息量最大的干预措施,使得他们的方法如此高效。

受复杂系统中极端事件研究的启发,研究人员使用一种称为输出加权的技术进一步改进了他们的获取函数。这种方法会仔细强调那些可能更接近最优干预的干预措施。

萨普西斯说:"从本质上讲,我们将最优干预视为所有可能的次优干预空间中的'极端事件',并使用我们针对这些问题开发的一些想法。"

提高效率和未来应用

他们在模拟细胞重编程实验中使用真实生物数据测试了他们的算法。在这项测试中,他们寻找一种能使平均基因表达发生预期变化的基因扰动。在多阶段实验的每一个步骤中,他们的获取功能都能比基线方法识别出更好的干预措施。

"即便在任何阶段中断实验,我们的方法仍然比基线方法更有效。这意味着可以进行更少的实验,却能得到相同或更好的结果,"张说。

研究人员目前正与实验人员合作,将他们的技术应用于实验室中的细胞重编程。他们的方法还可应用于基因组学以外的问题,如确定消费品的最优价格或在流体力学应用中实现最优反馈控制。

未来,他们计划加强他们的优化技术,使其超越那些寻求与期望均值相匹配的优化。此外,他们的方法假定科学家已经理解了系统中的因果关系,但未来的工作还可以探索如何利用人工智能来学习这些信息。

我们在FebBox(https://www.febbox.com/cnbeta) 开通了新的频道,更好阅读体验,更及时更新提醒,欢迎前来阅览和打赏。
查看网友评论   返回完整版观看

返回上一页  首页 | cnbeta报时: 16:33:38

文字版  标准版  电脑端

© 2003-2025