失眠网,内容丰富有趣,生活中的好帮手!
失眠网 > Cell|从人群结构 群体分层及基因渗入全面理解人类结构变异

Cell|从人群结构 群体分层及基因渗入全面理解人类结构变异

时间:2018-08-15 20:07:41

相关推荐

Cell|从人群结构 群体分层及基因渗入全面理解人类结构变异

撰文 | 胖胖企鹅

责编 | 兮

科学家们一直致力于对人类基因组多样性的挖掘与理解,期望更好地理解人类遗传多样性、人类进化历史以及推动基因组医学研究。目前,已有研究在全球水平对大城市人群进行低覆盖率的结构变异分析,但缺少对各个州的不同人群进行详细分析与比较。

因此,人类基因组多样性计划(Human Genome Diversity Project ,HGDP)收集了世界各地五十余种人群的遗传信息,尤其关注了人口较少的少数群体的遗传变异信息(图1)。

图1 HGDP数据库(每一个圆点与颜色分别代表了一种人群和其所在洲)

近日,英国Wellcome Sanger研究所的Yali Xue团队在Cell杂志上发表了题为Population Structure, Stratification, and Introgression of Human Structural Variation的研究,从人群结构、群体分层及基因渗入角度解读人群结构变异,并补充了人类参考序列中缺失的序列。

首先,该研究对全球54个人群中911个样本的全基因组测序结果进行了全面分析,共发现了126,018种结构变异。与已发表的变异数据库比较发现,78%的变异未被报道过,提示对少数人群的研究有助于更全面地理解遗传变异。

从人群结构来看,非洲人群高度分散,例如姆布蒂人(Mbuti)、比亚卡人(Biaka)、桑人(San)与其他非洲人群差异很大。更重要的是,结构变异包括插入、重复、多等位基因变异和倒位表现出了一定程度的种群结构分布(图2)。

图2 结构变异按人群结构分布

随后,该研究对古人类,主要是尼安德特人和丹尼索瓦人的基因渗入进行探究。因为过去报道发现,尼安德特人和丹尼索瓦人基因组中的上百个变异仅在非洲人群中出现,表明这些变异在非洲之外的地区已经丢失。因此,该研究进一步地分析在这两种古人类中常见但未在非洲人群中出现的变异,发现了63bp-30kb大小不等的结构变异。此外,作者还发现大洋洲人群特异的一些高频变异同样也出现在丹尼索瓦人基因组中。例如编码RNA解旋酶的基因AQR上的一个缺失频率高达63%,而该缺失只出现在丹尼索瓦人基因组中,表明曾经在大洋洲发生丹尼索瓦人基因渗入但随后又受到了隔离的清除。类似地,美洲人群中发现的高频缺失突变很可能是由尼安德特人的基因渗入。

除了常见结构变异类型外,该研究还观察到了失控重复(runaway duplications),即在全球水平低拷贝的变异在某一特定人群中出现极高的拷贝数。失控重复现象主要出现在非洲人群中,以HPR基因为例,该基因编码结合珠蛋白相关蛋白并参与抵抗锥体虫感染,它在非洲中部和西部人群中出现极高拷贝数变异。该研究认为,这种现象可能与受区域限制的进化选择有关。

图3 HPR基因在非洲人群的失控重复

最后,该研究从头组装基因组并恢复了参考基因组的缺失序列。具体地,他们利用linked-read方法对13个人群中的25个样本进行测序后,进行从头组装。将结果与GRCh38参考基因组做比较,发现了1643个无参考的独特插入变异,总计弥补了GRCh38中1.9 Mb的序列缺失。这些变异多为短片段插入,平均长度为513bp,一些位于外显子内或附近的插入很可能影响了基因功能。

有趣的是,该研究为了进一步探究这些变异的起源,将其与黑猩猩、大猩猩及红毛猩猩的参考基因组做比较。结果显示,62%的插入变异也出现在黑猩猩的参考基因组中,提示剩下的人类特异性变异的贡献者出现在黑猩猩之后。

图4 跨染色体的1643个无参考独特插入变异

总体来说,该研究完成了多样性人群结构变异图谱,其中包含大量未曾报道的变异与仅在特定人群高频出现的变异。古人类(尼安德特人和丹尼索瓦人)的结构变异对现代人的不同种群有着不同程度的基因渗入。从头组装基因组弥补了参考基因组中的缺失序列,在未来有待利用多种计算方法和数据来全面透彻地理解人类基因组所有的结构变异。

如果觉得《Cell|从人群结构 群体分层及基因渗入全面理解人类结构变异》对你有帮助,请点赞、收藏,并留下你的观点哦!

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。