许多遗传因素都会导致癌症,有些突变来自你的父母,有些是从其他外因或你自身 DNA 复制来的。大规模基因组测序已经有能力区分体细胞突变(somatic mutations)所引起的癌症,但是在鉴定哪些癌症可能来自父母遗传变异方面并没有那么有效。目前,我们对这类癌症相关突变的了解仍基于几个关键的家族研究。
现在,巴塞罗那基因组调控中心(CRG)的一组研究人员在 Ben Lehner 教授的领导下开发了一种新统计方法——从肿瘤基因组测序大数据中,提取癌症易感性基因。相关研究论文 刊登 在了《Nature Communications》杂志上。
论文第一作者、CRG 博后研究员 Solip Park 解释道:“我们的计算方法源于一个古老的想法,即癌症基因在导致癌症之前需要‘出击 2 次’。”
该方法允许研究人员在缺乏控制样本的情况下找到风险变量,也就是说,他们不需要将癌症患者与健康人群进行比较。“这是一个检测新癌症易感性基因的有力工具,”Park 说。
该方法被命名为 ALFRED,研究人员利用它鉴定出了 13 个癌症易感性候选基因,其中 10 个是全新的。我们将 ALFRED 套用于来自 30 种不同肿瘤类型的 10000 多个癌症患者的基因组,成功找到了已知的和未知的导致癌症风险的潜在癌症易感性基因,Ben Lehner 说。
“新发现的癌症易感性基因对许多类型癌症可能都具有重要作用,例如它们与 14% 的卵巢肿瘤、7% 的乳腺癌肿瘤和 2% 的所有癌症都有关联。其中,一个新发现的继承变异风险基因‘NSD1’可能影响着 3‰的癌症患者,”基因组数据科学实验室组长 Fran Supek 解释。
研究人员采用的是来自世界各地的癌症研究基因组数据,包括 TCGA(癌症基因组地图)项目,以及其他与癌症无关的几个项目。经过测试,这种新方法可以提高我们对癌症基因组学的理解,并利用公共数据进一步促进癌症研究、诊断和治疗。
“这项工作强调了共享基因组数据的重要性。应用新计算方法就能识别先前从未发现的重要癌症基因。只有比较跨医院、国家和疾病的数据资源,我们才能深入了解常见和罕见疾病。遗憾的是,许多研究者仍不愿意分享他们的数据,这是需要积极改变的社会现状。”
原文检索:
Systematic discovery of germline cancer predisposition genes through the identification of somatic second hits
来源:生物360