2023年9月17日,国际知名学术期刊Molecular Biology and Evolution在线发表了复旦大学徐书华教授团队和西藏民族大学康龙丽教授团队合作题为“Genetic origins and adaptive evolution of the Deng people on the Tibetan Plateau”的研究论文。该论文分析了生活在我国青藏高原地区的僜人的全基因组测序数据,解析了该群体的遗传结构和重构了其演化历史;通过进一步比较研究僜人与藏族、夏尔巴人等的高原群体的基因组多样性特征,初步阐明了青藏高原人群的适应性进化和趋同进化机制。
青藏高原是世界上海拔最高的地区之一,其极端环境对人类生存提出了巨大挑战,对青藏高原原住民的研究对理解人类演化机制有重要意义。近年来,国内外多个研究团队从基因组、表型组等各方面对高原人群的遗传多样性及适应性进化进行了深入研究和探讨,取得突破性进展,但这些研究均集中在高原的主体族群——藏族,非藏族人群则罕有研究和报道。值得一提的是,除藏族之外,其他高原族群在前期研究中均罕有涉及,而这些族群在历史文化和遗传特征上各具特点,对研究高原上多族群的源流、族群分化及融合的意义重大,更是高原适应性进化研究无可替代的研究对象,以及探索趋同演化机制不可或缺的一环。
青藏高原上生活的众多人群之中,有一支颇具神秘色彩的僜人。他们居住在青藏高原东南部的雅鲁藏布江大峡谷之中,是中国未识别少数民族之一。早期的民族学调查显示,解放之前的僜人过着刀耕火种、兼行采猎的生活。僜人没有自己的文字,其语言属于汉藏语系-藏缅语族。虽然僜人与藏族一样生活在青藏高原地区,但与藏族沟通较少,且不与藏族通婚。由于长期与世隔绝,人们对于僜人的起源、以及他们与其他藏缅语系人群(如藏族和夏尔巴人)之间的联系都所知甚少。同为高原人群,僜人与藏族之间的遗传关系如何,两者是否源于共同祖先,人群演化遵循何种模型?僜人适应高原耐受低压低氧的遗传基础和机制是否与藏族类似?这些疑问长期悬而未决,且是高原研究领域值得深入探讨的关键科学问题。
该研究分析了西藏林芝地区察隅县54个僜人样本的全基因组深度测序数据,并与藏族、夏尔巴人的全基因组数据进行比较研究。结果表明,虽然僜人与藏族、彝族、纳西族等生活在青藏高原上或者青藏高原周边的人群的遗传关系最近、基因组相似度最高,但僜人与其他青藏高原少数民族具有不同的群体结构,尤其是相较于藏族僜人有着更高的群体同质性;表现为更高的基因组纯合度、更多的长片段纯合基因型以及更低的核苷酸多样性等;这些明显的群体基因组特点反映了僜人长期隔离的生活状态。此外,僜人的祖源构成单一,缺乏源自其他人群的基因流,且这种单一成分在藏族和夏尔巴人中也有较高比例的发现。研究团队结合968个亚洲古人基因组进行联合分析和比较研究,结果显示僜人高原特异性的祖源成分可以追溯到古代东北亚人群。与此同时,该研究对人群分化的时间进行了估计,推算出僜人与藏族祖先人群分化发生于距今约4,700至7,200年前,这个人群分歧时间晚于高原人群与汉族祖先人群的分离时间;例如,僜人与汉族祖先人群分化于距今约9,000至14,000年前;藏族与汉族祖先人群分化于距今约7,200–10,000年前。综合多方面的分析结果,该研究建立了高原族群的群体历史演化模型:距今约 9,000-14,000 年前,僜人、藏族和夏尔巴人等青藏高原少数民族群体的共同祖先与低海拔的东亚北部祖先人群发生群体分化;随后在距今约7,000-9,000年前,青藏高原人群的共同祖先分化为两支,一支发展为现今的僜人,一支发展为现今的藏族;之后两个人群在青藏高原不断繁衍、分化和融合,构成了高原人群不可分割的部分。
图1 | 僜人与欧亚大陆人群之间的遗传关系与遗传祖源构成
A. 僜人与欧亚大陆人群的主成分分析
B. 以欧亚大陆人群为参考的僜人、藏族与汉族的遗传祖源成分解析
高原适应的遗传基础与进化机制一直是高原研究的核心问题,该研究运用多种群体遗传学和统计学方法来检测僜人群体基因组的自然选择印迹。结果表明,在僜人中鉴定的适应性变异中,仅有部分与先前藏族研究中报道的有所重叠(如HLA-DQB1),而其他适应性变异(如KLHL12)在藏族中未被报道过。值得一提的是,在此前藏族研究中被广泛报道的高原适应基因EPAS1、EGLN1 和 TMEM247等在僜人中并未显示出强烈的正选择信号。考虑到僜人居住地多位于高原的峡谷地带,与青藏高原其他地区相比,其海拔相对较低,其适应机制与藏族预期有所差异。此外,以KLHL12 和 HLA-DQB1为代表的免疫相关基因内部的选择信号也反映了僜人面临与其他高海拔地区所不同的峡谷环境而产生的适应性。此前有多项研究报道了藏族EPAS1基因区域存在来源于丹尼索瓦人(Denisova)的基因片段;但是有趣的是,僜人基因组中的古人渗入片段与藏族的差异明显,尤其是僜人EPAS1基因区域附近来自丹尼索瓦人的基因序列比例远远少于藏族。以上的结果都提示了僜人与藏族在环境适应的遗传基础和进化机制上可能存在显著差异,这也在一定程度上反映出人类对高原环境的适应可能存在趋同进化的机制并且有可能是普遍存在的现象。
图2 | 僜人基因组的局部祖源分析以及适应性进化分析
A. EPAS1基因区域的古人基因组序列分布图
B. 僜人HLA-DQB1基因区域的自然选择印迹
综上所述,该研究弥补了青藏高原多民族遗传学研究尤其是罕为人知的僜人的基因组学研究空白,有助于系统了解该人群的遗传多样性和群体演化历史,揭示青藏高原人群遗传多样性,探讨趋同进化的高原适应性进化机制,从而促进研究者从多族群角度出发,充分考虑高原人群间个性和共性,重新审视以青藏高原为整体研究人群适应极端环境机制的研究策略和范式。
中国科学院上海营养与健康研究所博士生葛雪皊、复旦大学陆艳副教授和上海科技大学硕士生陈双慧为该论文的共同第一作者,复旦大学徐书华教授和西藏民族大学康龙丽教授为该论文的共同通讯作者。该工作前期得到了原住民参与者以及察隅县人民医院医疗团队的大力支持。相关工作得到了国家自然科学基金、上海市级科技重大专项、西藏自治区科技厅项目和西藏民族大学"高峰学者计划 "等资助。该项研究所涉及的样本信息和数据的公开发表已获得国家人类遗传资源管理部门批准。