AI发现了隐藏在"垃圾"DNA片段中的癌症驱动因素

摘要:

加文医学研究所(Garvan Institute of Medical Research)的研究表明,占我们基因组98%的非编码DNA(以前被认为是"垃圾")可能在癌症诊断和治疗中起着至关重要的作用。

研究发现,这些区域的突变与 12 种不同的癌症类型有关。这些突变发生在CTCF蛋白的结合位点上,而这些位点对于维持基因组的三维结构至关重要。这些位点的破坏可能会导致癌症的发生。研究结果表明,针对这些不同癌症的共同突变,有可能找到一种通用的癌症治疗方法。

根据加文医学研究所(Garvan Institute of Medical Research)的一项新研究,非编码DNA--占我们基因组的98%,不包含制造蛋白质的指令--可能是新的癌症诊断和治疗方法的关键。这些研究结果发表在《核酸研究》(Nucleic Acids Research)杂志上,揭示了以前被忽视的基因组区域中的突变,这些突变可能导致至少 12 种不同癌症的形成和发展,包括前列腺癌、乳腺癌和结肠直肠癌。

这一发现可能会带来早期诊断和对多种癌症有效的新疗法。

"非编码DNA由于明显缺乏功能,曾一度被视为'垃圾DNA',该研究的共同通讯作者、加万研究官阿曼达-库里(Amanda Khoury)博士说。"我们的研究发现,这些DNA区域的突变可能为癌症治疗开辟一种全新的通用方法。"

DNA-Damage-in-Human-Breast-Cancer-Cells_jpg.jpg

人类乳腺癌细胞(蓝色)中可视化的 DNA 损伤(绿色)。资料来源:加文研究所

研究人员重点研究了影响一种名为 CTCF 的蛋白质结合位点的突变,这种蛋白质有助于将 DNA 长链折叠成特定形状。在之前的研究中,他们发现这些结合位点能将 DNA 的遥远部分拉近,形成三维结构,从而控制基因的开启或关闭。

Khoury博士说:"我们已经确定了一个'持久'的CTCF结合位点子集,即它们就像基因组中的锚,存在于不同的细胞类型中。我们假设,如果这些锚出现问题,就会破坏基因组的正常三维组织,导致癌症。"

为了验证这一点,研究人员开发了一种名为CTCF-INSITE的新型复杂机器学习(AI)工具,它利用基因组和表观基因组特征来预测哪些CTCF位点有可能成为12种癌症类型中的持久性锚点。然后,他们评估了国际基因组联盟数据库(International Genome Consortium database)中这12种癌症类型患者的3000多份肿瘤样本,发现这些持久性锚点富含突变。

Amanda-Khoury-and-Susan-Clark-scaled_jpg.jpg

阿曼达-库里(Amanda Khoury)博士和苏珊-克拉克(Susan Clark)教授在澳大利亚悉尼的加文医学研究所(Garvan Institute of Medical Research)。图片来源:加文研究所

该研究的第一作者陈文汉博士说:"利用我们的机器学习工具,我们确定了 12 种不同癌症类型中的持久性 CTCF 结合位点。值得注意的是,我们发现每个癌症样本中都至少有一个持久性 CTCF 结合位点发生了突变。"

"这项研究证实,持续存在的 CTCF 结合位点是癌症中的'突变热点'。我们认为这些突变给癌细胞带来了生存优势,使它们能够增殖和扩散,"Khoury 博士补充说。

这些发现可能对了解和治疗多种类型的癌症产生广泛影响。加文癌症表观遗传学实验室主任、该研究的主要作者苏珊-克拉克教授说:"大多数新的癌症治疗方法都必须仔细地针对特定的突变,而这些突变在不同的肿瘤类型中并不总是常见的,但是由于这些CTCF锚在多种不同的癌症类型中都发生了突变,我们就有可能开发出对多种癌症都有效的方法。"

研究人员目前正计划利用CRISPR基因编辑技术进一步开展大规模实验,研究这些锚突变是如何破坏三维基因组并可能促进癌症生长的。

克拉克教授说:"既然我们已经发现了我们认为是基因组的关键锚,并证明它们对维持基因组结构的平衡非常重要,那么这些非编码DNA突变会破坏癌细胞中的这种平衡也就说得通了--我们将在编辑这些突变时对这一假设进行检验。通过观察下游影响,我们希望找出受突变影响的关键基因或基因通路,它们可以作为癌症早期检测的标记或新疗法的靶点。"

"找到这些隐藏在海量数据中的线索,是人工智能如何促进医学研究的有力例证,"她说。"这是癌症研究的一个全新领域,我们很高兴能进一步探索它"。

编译自/ScitechDaily

查看评论
created by ceallan