科学家在人体基因组中识别出全新变异高发区域
科技日报北京11月25日讯 近日,科学家们发现了人类基因组中一种极易发生突变的新区域,这一发现将有助于我们深入理解遗传学、疾病机制以及基因突变的遗传规律。研究由西班牙巴塞罗那基因组调控中心牵头,在新一期《自然·通讯》杂志发表。研究人员标明,这些高突变区域正位于基因的起始端——即转录起始位点,这些DNA片段发生改变后还能遗传给下一代,意义十分重大。
据介绍,科学家在调查中发现,基因起始位点后前100个碱基发生突变的概率比一般区域高了35%。这些序列是细胞将DNA信息抄录为RNA的起点,是基因组中不可或缺的功能片段,与负责编码蛋白质的序列一样关键。由于这些区域高度活跃,发生突变的风险也显著增高,是整个人类基因组中最重要同时也是最脆弱的片段之一。
研究同时表明,不少额外的突变发生在受精卵分裂的最初几轮,也就是胚胎早期时,这类突变仅存在于部分细胞,被称为“镶嵌突变”,不会遍布整个身体。这也是此前这些突变不易被察觉的主要原因。即使父母带有这种局部突变,因为并不影响身体所有细胞,也往往没有表现出疾病症状,但一旦通过卵子或精子传递给子女,使后代全身细胞都带有该突变,就有可能引发某些疾病。
此次,研究团队通过分析英国生物库中超过15万人类基因组数据,并结合对7.5万个基因转录起始位点的逐一比对,同时引入11个独立家族中发现的镶嵌突变数据,确认了这些基因区域出现异常多突变的现象。值得注意的是,与癌症、神经系统疾病及四肢发育异常相关的基因起始区,突变数目更为明显。
进一步观察更古老且常见的遗传变异时可以发现,危险性较高的突变在历史发展中往往逐渐消失,也即自然选择已经滤除了这部分有害变异。换句话说,某些家系中那些影响癌症风险或脑功能的有害突变,并不容易代代相传,遗传多代后会逐步减少直至消失。
如今,遗传学分析会借助一套基准突变概率模型来评估并识别值得关注的基因变异,但这些模型并非完全了解自然状态下的突变热点。如果模型无法识别这些高突变区域,结果判断可能偏离事实。例如,模型可能推测某区域应该只有10次突变,观察实际数据却达到50次,而真实的自然水平可能高达80次,正是这一模型上的缺失为本项研究带来了重要突破。





