遗传变异图谱是研究群体进化史、医学遗传学和基因型-表型相关性的基础。此前,大多数全基因组测序相关研究都集中在欧洲血统的人身上。先前的研究表明,罕见和低频变异通常具有人群或样本特异性,尤其是与疾病相关的变异。中国人群缺乏全基因组测序资源和单倍型参考面板,阻碍了世界上最大人群的遗传学和精准医学研究。
使用权:
阿里云11.11云嘉年华活动厅
为此,中国科学院院士、中国科学院生物物理研究所研究员徐涛团队与何顺民研究员团队在Cell Reports在线发表文章,介绍了该团队的研究成果致力于“NyuWa”(NyuWa)中国人群基因组资源库,为中国人群提供遗传变异图谱和参考面板基因型推导服务,旨在推动中国人群的遗传学和医学研究。
研究团队分析了2999名以“女娲”命名的中国人的全基因组深度测序数据(26.2X)。
NyuWa 全基因组测序资源中的变异数量
该研究基于NyuWa数据资源,构建了包含7106万个SNP和819万个InDels的中国人群遗传变异图谱,并对其进行了充分注释。与其他人群队列相比,NyuWa数据集包含2501万个新变异,其中包括149,000个非同义变异、101,000个有害变异、11,493个编码和非编码基因的功能丧失变异以及636个癌症相关基因的蛋白质截断。突变。
大量的新变异表明,在以往的遗传学研究中,中国人群的变异代表性不足,而NyuWa基因组资源填补了这一空白。
此外,基于临床相关数据库的注释,研究发现NyuWa中有1140个致病变异,以及中国人群与世界其他人群在药物基因组学相关位点和癌症风险位点的变异频率存在差异。这些发现有助于中国人群的精准医学研究,并可能促进新的遗传学和医学进步。
与其他参考组相比,NyuWa 参考组将汉族人群中基因型推算的错误率降低了30%-51%,并且在大多数其他东亚和东北亚人群中也表现良好。