南方网讯 (全媒体记者/张光岩)10日,华大在深圳国家基因库正式对外发布一项迄今为止最大规模的中国人基因组学大数据研究成果。这是由中国科学家主导,历时两年,对14余万中国人的无创产前基因检测数据进行深入研究后,首次揭秘中国人群基因遗传特征的科研成果,也是由华大主导的“百万人群基因大数据研究”项目的首秀。
在本次研究中,华大的研究小组成功构建了包含904万个多态性位点在内的中国人基因频率数据库(CMDB),其中约有20万个多态性位点属于首次发现,这是目前正式发表的最大规模的中国人群基因频率数据库。
值得一提的是,研究小组确定了6个在地区纬度方向上受到强烈自然选择的基因,它们在基因频率上呈现明显的南北差异,充分展现了饮食、气候、病原体等环境因素对中国人群的演化所起到的选择作用。
与机体免疫功能相关的编码红细胞补体受体I的基因CR1呈现了南方富集的现象。古代中国南方自然环境恶劣,病原微生物尤其是疟疾盛行,因此对于生存于该地区的人在免疫力方面有较高的要求。
通过数据分析,研究小组一次性发现并且验证了48个与身高以及13个与BMI(身体质量指数)显著相关的基因位点,包括这些位点在内的常见突变位点分别解释了48%的身高遗传率以及10%的BMI遗传率。随着研究的进一步深入,科学家和算法工程师有可能利用这些信息构建适合于中国人的身高预测模型,通过基因数据推断个人的身高情况。
另外,研究小组对怀孕年龄和双胎怀孕两个表型进行了深入分析,发现了两个与怀孕年龄显著相关的基因位点,暗示着这两个位点的突变与生育力密切关联;与此同时,还在NRG1基因中发现了一个和双胞胎妊娠显著相关的突变位点,也就是说携带NRG1基因的突变,有更高的几率怀上双胞胎。