近日,复旦大学、西安交大、中国医学科学院等26家单位联合发布了中国人群泛基因组联盟(CPC)一期研究进展。6月14日,相关成果以《基于36个族群的中国人泛基因组参考图谱》(“A Pangenome Reference of 36 Chinese populations”)为题发表于《自然》(Nature)主刊。据悉,这是我国学者领导的人群基因组研究首次发表在《自然》主刊。
这项研究初步构建了我国人群的泛基因组参考图谱,发现了在人类通用参考基因组上缺失的约1.9亿个碱基对的参考序列;新鉴定了约580万个点突变或小变异以及3.4万个结构变异,涉及大量潜在功能原件包括至少1367个蛋白质编码基因;并发现通用参考基因组上缺失的参考序列富集了适应性演化和起源于远古人类的遗传变异,并且与角质化、紫外线辐射应激、DNA 修复、免疫反应以及寿命等表型或功能相关。这项研究也显示了,建立我国自己的人群泛基因组图谱十分必要。在重构人类演化历程、挽回复杂疾病研究时“丢失的遗传率”等研究和应用中,该图谱具有巨大的潜在价值。
人类参考基因组是广泛用于人类遗传学和医学研究的遗传密码“导航图”,也是解析人类起源与演化、解析人类表型和疾病的遗传基础的根基。上世纪末“人类基因组计划”启动后的20年里,人类参考基因组作为生命、医学等研究领域的基石见证着人类在探索生命奥秘的漫漫征途上留下的或深或浅的足迹。从2001年首次发表人类基因组草图,人类参考基因组经历了数十次的更新迭代,发展到目前广泛使用的第38版本(GRCh38)。直到2022年从“端粒到端粒”联盟(T2T)构建的“无缺口”的T2T-CHM13参考基因组完成图,所有涉及人类遗传学的研究仍然依赖于线性参考基因组。今年正值国际人类基因组计划(HGP)完成20周年,人类参考基因组从“线性一维序列”过渡到“泛基因组多维图谱”。实际上,基因组的组装一开始就借助了数学中的“图论”思想和理论,加之计算机算法,实现了特定物种基因组元件的顺序排列。泛基因组(Pangenome)进一步借助图论的思想和计算技术,将人类多个族群的代表性样本的具有多样性的基因序列以多维图谱形式组装起来,形成一个能充分反映种群基因组结构变异多样性的导航图,从而指导进一步的遗传学和医学研究。