第一作者简介:黄美莎(1991—),女,山东济宁人,硕士,研究方向为法医遗传学。E-mail:315736922@qq.com
藏族居于高海拔地区,近年来通过关于藏族高原适应性的研究发现,藏族与其他人群的高原适应机制不同,其原因在于基因EPAS1和EGLN1上存在大量的频率差异较大的单核苷酸多态性(SNP)位点。本文从生理机能变化、高原适应性基因以及基因中SNP位点三个层面对藏族的高原适应性进行综述,并展望高原适应性相关的SNPs应用于法医学及鉴定的前景。
Tibetan people live in Himalayan plateau southwest of China, having well adapted to the extreme environment of such a high altitude. Recent studies showed that several candidate genes have led the Tibetan people to possess different mechanism from lowland-living Chinese to adapt to the high-altitude hypoxia environment. Two hypoxia-related genes, EPAS1 (endothelial PAS domain protein 1; also known as HIF2a) and EGLN1 (egl nine homolog 1; also known as HIF prolylhydroxylase 2, PHD2), have been identified to associate with the high-altitude hypoxia adaptation such that a large quantity of frequency-diverse SNPs have been found among them. In this paper, Tibetan people’s adaptation to high-altitude is reviewed from three aspects: their physiological characteristics and functional conversion, high-altitude adaptation genes, and the SNPs in EPAS1 and EGLN1. Accordingly, the forensic feasibility of high-altitude adaptation-associated SNPs is thereby discussed.
伴随不同国家或区域间的人员流动显著增加, 涉外反恐、跨区域流动作案等复杂案件逐年增多。如果能够通过现场遗留DNA的分析获取人员身份、种族和地域来源等信息, 将能对案件定性、侦办等提供重要的科学线索, 至少也可缩小侦察范围, 便于现场勘查、警情处理和人员调动等工作的开展。
单核苷酸多态性(single nucleotide polymorphisms, SNPs)是基因组中单个碱基变异形成的一种多态性, 广泛分布在基因组的编码区和非编码区, 蕴含大量与人的表型特征等相关的信息, 可用于群体遗传结构分析、疾病关联研究等。在法医学领域, SNPs是常用的一种祖先信息位点(ancestry informative markers, AIMs), 可用于DNA供者的族群地域推断[1], 目前国内外报道了大量的AIMs组合用于区分欧、东亚、非洲等洲际大跨度人群及混合人群[2, 3, 4], 但是, 对于东亚地区尤其是我国亚人群的族群推断体系罕有报道。藏族是典型的高原人群, 其全基因组关联分析研究发现EPAS1、EGLN1、PPARA等基因与藏族人群的高原适应性有关, 这些基因上有大量的SNP位点, 在高原和平原人群之间存在频率差异[5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17], 藏族人群高原适应性遗传机理的研究对于其法医学应用具有重要的基础作用。
藏族人群约在两万年前就定居于青藏高原(海拔3000~5000 m), 是典型的高原人群。我国境内藏族人口约680万, 主要分布在西藏自治区、四川、云南以及青海、甘肃等地。另外, 尼泊尔、巴基斯坦、印度、不丹等国境内也分布着藏族人群。藏语属于汉藏语系藏缅语族藏语支。平原人初入高海拔地区(海拔大于等于3000 m)会出现高原反应, 表现为头痛、睡眠障碍、恶心、呕吐、胸闷、气短、心悸等。相反, 即便是久居低海拔地区的藏族人到海拔3700 m时心率也无明显变化[18]。低海拔地区的人群进驻高原后, 机体通过血红蛋白浓度代偿性增高来适应低氧环境, 血红蛋白的过度增高会导致血液粘稠, 进而易患慢性高原病(chronic mountain sickness, CMS)。藏族人群世居于高海拔地区, 与进驻高原的平原人相比具有较高的血氧饱和度、较高的静息肺通气量、缺氧时较弱的肺血管收缩反应以及低水平的血红蛋白浓度[19, 20, 21], 这一系列改变有效地保证了高原人群的正常生活。与同样居住高海拔地区的安第斯山人相比, 两者具有不同的适应机制, 相关研究表明, 同一海拔情况下藏族人的静息肺通气量比安第斯山人高一个标准差, 但是藏族人的血红蛋白浓度比安第斯山人低一个标准差。西藏、青海、四川、云南以及印度藏族的ABO血型分布也具有差异性[22]。这些都反映了高原适应具有明显的地域差异, 也表明了青藏高原地区藏族的独特性。
藏族人在高原适应方面具有遗传学基础[6, 7, 8, 10, 16]。缺氧诱导因子通路(hypoxia-inducible factor (HIF) pathway)是机体调控氧平衡的主要信号通路, 也是藏族高原适应的关键信号通路。在藏族人群中, HIF通路通过对血红蛋白、血管形成及舒缩等血液相关基因的调控, 提高了血红蛋白的携氧能力; 通过对能量代谢相关基因(糖酵解酶类、乳酸脱氢酶A、单羧基转运体4等)的下调, 降低了机体新陈代谢水平, 减少氧与能量的消耗; 通过对免疫相关基因调节, 防止炎症反应, 使细胞避免损伤[23]。全基因组关联研究发现, 在HIF通路上发现大量候选基因在高原和平原人之间存在差异, 例如:EGLN1、EPAS1、PPARA、HMOX2、HBG、HBG2、PKLR等[14, 17], 其中, EGLN1和EPAS1两个基因位于HIF通路的上游, 对于藏族人的高原适应作用比较显著[5]。EPAS1(Endothelial PAS Domain Protein 1)定位于人染色体2p16-21上, 序列长度约为90kb, 直接调控EPO(红细胞生成素)的表达, 在低氧环境下能够促进EPO的合成进而提高血红蛋白浓度, 基因突变后对缺氧引起血红蛋白升高反应迟钝。有学者研究认为受到自然选择的EPAS1基因可能来源于一种原本生活在欧亚大陆西伯利亚地区的古老人群丹尼索瓦人的基因渗入, 藏族人群90%以上携带有此序列的基因, 汉族人群中这一基因的比例较小[9]。EGLN1(egl nine homolog 1)是一种双加氧酶的氧感受器, 对EPAS1具有负向调控作用, 基因突变后提高EGLN1酶的活性, 从而促进EPAS1的降解, 在低氧环境下EPO的表达减少[10]。藏族人因为EGLN1、EPAS1等基因上存在大量的单核苷酸多态性位点, 对低氧诱导的反应相对迟钝, 血红蛋白浓度即使在高海拔情况下依然保持相对稳定的水平, 进而与平原汉族相比不易患高原病[15]。Laura等[24, 25]对西藏的藏族人群和安第斯山人群的高原适应机制进行了比较分析, 西藏藏族人群高原适应性相关基因主要为EPAS1和EGLN1, 而安第斯山人群与高原适应最相关的基因为PRKAA1和NOS2A, 研究表明西藏藏族人群和安第斯山人群高原适应候选基因存在差异。
全基因组关联研究发现了大量藏族人群与平原人群之间存在有显著差异的SNP位点。Huerta-Sanchez等[9]通过对各40个藏、汉族个体的EPAS1基因重测序发现了一种独特的单倍型, 这种单倍型由5个SNPs位点形成, 即rs115321619、rs73926263、rs73926264、rs73926265、rs55981512, 此单倍型(AGGAA)只存在于藏族人和丹尼索瓦人中, 而在40个汉族个体中均未检出; EPAS1上的rs1562453在西藏藏族、青海藏族与汉族间等位基因频率具有显著差异, 但是在云南藏族和汉族间等位基因频率差异不显著, 这进一步说明了同属高海拔的藏族也存在地域的差异性, 说明高原环境对世居人群EPAS1基因有选择作用[26]; 此外, EPAS1上的rs13419896、rs4953354和1868092在藏族与非藏族人群间具有显著差异[13]。Xiang等[10]通过EGLN1基因重测序技术共检测到185个差异位点, 其中rs18699510(D4E)是一种非同义突变, 其在藏族与平原人群间显示出非常大的分布差异, 在藏族和汉族人之间的FST值达到0.709, 藏族人中的平均检出率为70.9%, 而在汉族、日本、欧洲和非洲等平原人群中非常稀少, 检出率仅为0.56%~2.27%, 是典型的自然选择差异位点, 具有类似特点的SNP位点还有rs12097901。通过单倍型网络分析, 在EPAS1和EGLN1基因上还发现了大量与平原人群有差异的单倍型[10]。再者, EPAS1和EGLN1上存在有与急性高山病(acute mountain sickness, AMS)相关的SNPs位点。EPAS1上的rs4953348位点多态性与AMS发病易感性相关, GG(鸟苷酸纯合子)基因型频率在病例组中远高于其对照组值(53.8%vs38.4%), 并且藏族人群中的腺苷酸A等位基因占主导[27], 平原汉族人群携带GG基因型则患AMS的风险大[28]。EGLN1上的rs480902的TT(胸腺嘧啶核苷酸纯合子)基因型在AMS患者中频率高于高原藏族人群[29], 以上研究说明平原汉族中AMS易感人群携带的SNP位点基因型频率要高于藏族人群。
用一组群体间基因频率差异显著的DNA多态性位点可以进行人群遗传结构的区分[1]。法医学群体来源推断相关研究[2, 3, 4]的一般策略如下:首先, 使用高通量SNP检测技术对人群间频率差异显著的SNPs位点进行大量选择, 例如全基因组芯片技术和新一代测序技术等, 或者通过文献报道获得差异性位点。然后, 对差异性位点进行群体间遗传多态性及遗传结构比较分析。最终, 进行种族推断复合检测体系的构建。本项目组此前就构建了27重SNP复合检测体系, 用于欧洲、非洲、亚洲人群的遗传结构分析和个体的种族推断[2]。
上述相关研究发现了高原适应基因中存在藏族与其他人群间频率差异显著的SNPs位点, 这些位点是依据群体来源推断策略进行法医学DNA群体信息特征刻画研究的理论前提。目前, 法医学领域已有研究报道, 对高原适应基因的人群差异性SNPs位点进行复合体系构建和多态性评估。例如, 杨鑫等[30]基于EPAS1和EGLN1中的10个SNPs位点(rs12907901、rs13419896、rs150877473、rs1562453、rs1 86996510、rs2491406、rs2491407、rs4953360、rs4953361、rs758962), 利用SNaPshot 多重分析试剂盒获得了518名甘肃、青海无关藏族个体和134名平原汉族无关个体的等位基因分型。基于基因频率分析发现, 藏汉人群在4个SNPs位点上存在显著差异(rs150877473、rs1562453、rs186996510、rs7589621), 此研究采用SNaPshot技术[31]基于PCR-CE平台进行复合体系构建。我国公安系统大部分物证鉴定实验室配备有3130、3500等毛细管电泳仪, 而SNaPshot技术操作简单, 可快速掌握, 故易于普及和推广。总之, 将藏族特异性SNPs位点用于法医学种族推断研究无论在理论还是技术上均具有可行性。
综上所述, 生活在高原地区的藏族以其独特的生理机能变化适应了高原低氧环境, 由于自然选择等因素, 在EPAS1、EGLN1等基因上存在有大量为高原人群所特有的差异位点。据此, 通过高通量的SNP检测技术筛选出高原与平原人群间差异显著的这些高信息量位点, 进行群体遗传结构分析、未知个体种族推断等法医学研究, 具可行性。
The authors have declared that no competing interests exist.
作者已声明无竞争性利益关系。The authors have declared that no competing interests exist.
[1] |
|
[2] |
|
[3] |
|
[4] |
|
[5] |
|
[6] |
|
[7] |
|
[8] |
|
[9] |
|
[10] |
|
[11] |
|
[12] |
|
[13] |
|
[14] |
|
[15] |
|
[16] |
|
[17] |
|
[18] |
|
[19] |
|
[20] |
|
[21] |
|
[22] |
|
[23] |
|
[24] |
|
[25] |
|
[26] |
|
[27] |
|
[28] |
|
[29] |
|
[30] |
|
[31] |
|