第一作者简介:王敬群,男,辽宁营口人,学士,研究方向为法医遗传学。E-mail: 369105018@qq.com
目的 研究通化地区朝鲜族人群29个Y-STR(Y chromosomal short tandem repeats,Y-STR)基因座的遗传多态性及其与国内其他民族群体的遗传关系。方法 采用DNATyperTMY29荧光复合扩增检测试剂盒,检测539名通化地区朝鲜族无关个体29个Y-STR基因座的DNA分型,计算基因频率等群体遗传学数据,与13个其他民族群体进行遗传距离比较分析。结果 通化地区539名朝鲜族个体观察到228个基因和531种单倍型;单倍型多态性(haplotype diversity,HD)值为0.999940;基因多态性(gene diversity,GD)值在0.3138(DYS391)到0.9656(DYS385ab)之间;匹配概率(matching probability,MP)0.001917,系统鉴别能力(discrimination capacity,DC)值0.985158。通化朝鲜族和首尔韩民族(亦称朝鲜族)人群的亲缘关系最近,与吉林满族人群的亲缘关系最远。结论 所测29个Y-STR基因座在通化地区具有较好的多态性分布,本研究所得基因频率、多态性等数据,可为该地区的群体遗传学和法医学研究与应用提供基础数据参考。
Objective To probe into the genetic diversity of 29 Y-STR loci of Korean-ethnic population in Tonghua area (of China’s Jilin province) and the genetic relationship with other ethnic groups in China.Methods Fluorescent DNATyperTMY29 direct amplification kit was adopted to detect 539 Korean-ethnic unrelated individuals in Tonghua area, having the 29 Y-STR loci genotypes obtained so that the genetic data, e.g., gene frequency, were calculated and the genetic distance was comparatively measured against China’s other 13 ethnic groups.Results There were 219 genes and 531 haplotypes being observed from the tested 539 Korean-ethnic individuals. The haplotype diversity (HD) value was 0.999940. The gene diversity (GD) ranged from 0.9656 (DYS385ab) to 0.3138 (DYS391), with the matching probability (MP) being 0.001917 and the discrimination capacity (DC) 0.985158. The closest genetic relationship showed present between the Tonghua Korean-ethnic population and the same people in Korea’s Soul, with the farthest one occurring to Jilin’s Manchu population.Conclusions The here-tested 29 Y-STR loci revealed a high polymorphic distribution among the Korean-ethnic population in Tonghua area. Both the gene frequencies and polymorphism statistics obtained with this survey can provide basic data for population genetics and/or forensic research and application in that region.
Y染色体短串联重复序列(Y chromosome short tandem repeats, Y-STR)位于染色体的非重组区, 具有父系遗传(即男性特有)、遗传过程中不发生重组或重组率低等特点。因此Y-STR的遗传多态性研究可为男性个体家系排查、法医个体鉴定、亲子鉴定、人群迁徙史探查、父系溯源等方面提供重要依据[1, 2]。本研究对通化地区朝鲜族人群进行29个Y-STR基因座(DYS385ab、DYF387S1、DYS19、GATA-H4、DYS576、DYS635、DYS643、DYS389I、DYS389II、DYS437、DYS438、DYS448、DYS449、DYS390、DYS391、DYS392、DYS393、DYS456、DYS439、DYS444、DYS447、DYS458、DYS460、DYS481、DYS508、DYS518、DYS533)的多态性调查, 旨在对该地区的朝鲜族人群的基因特征、人口迁徙、基因融合与进化等作分析, 为该地区的人类遗传学和法医学研究应用提供基础数据参考。
采集居住在通化地区的539位朝鲜族健康男性无关个体的口腔上皮细胞样本, 涂布于样本卡(长春博坤公司)上, 阴凉干燥后常温保存待用。本研究得到公安部物证鉴定中心科研伦理委员会的批准(审批编号:2020-009), 所有样本供者在采样前均签署了知情同意书。
采用直接扩增法[3, 4, 5], 按照DNATyperTMY29试剂盒(公安部物证鉴定中心)说明书推荐的反应体系和条件进行扩增检测, 所有样本均取直径0.5 mm圆片两份。用Gene Max扩增仪(杭州博日科技有限公司)扩增, 所得产物以3500xL型遗传分析仪(美国Life公司)电泳检测, 收集原始数据并以GeneMapper ID-X 1.5软件进行Y-STR分型。
Y-STR分型实验按照ISFG(International So-ciety of Forensic Genetics)DNA委员会的建议进行[6], 使用9948(美国Promega公司)和超纯水(德国密理博公司)分别作为阳性和阴性对照, 检验遵从公安部物证鉴定中心DNA实验室通过中国合格评定国家认可委员会(CNAS)实验室认可的要求与程序。本研究所获得的539份通化朝鲜族人群数据已通过YHRD质量控制审核(编号为YA004700)。
根据Y-STR分型数据, 用直接计数法计算基因座的基因频率和单倍型检出频率, 其中双拷贝基因座DYS385ab和DYF387S1按照单倍型计算。根据文献[6]推荐方法计算基因多样性(gene diversity, GD)和单倍型多样性(haplotype diversity, HD):GD、HD=n(1-Pi2)/(n-1)(Pi分别为基因频率和单倍型频率, n分别为样本数和观察到的单倍型个数); 系统鉴别能力(discrimination capacity, DC)=Ndiff/N, 其中Ndiff代表观察到的单倍型种类数, N代表样本量; 匹配概率(match probability, MP)=Pi2。利用YHRD网站(www.yhrd.org)在线统计工具进行分子方差分析(analysis of molecular variance, AMOVA), 计算并生成群体间相互遗传距离Rst值矩阵, 构建多维尺度分析(multi-dimensional scaling, MDS)和系统进化图(Mega 7.0软件, www.megasoftware.net)。
29个Y-STR基因座包含25个单拷贝基因座和2个双拷贝基因座(DYF387S1和DYS385ab, 按照4个Y-STR基因座计算)。整理计算得到的基因频率见表1, 发现在所测539名通化地区朝鲜族个体中有228个基因和531种单倍型(见补充材料表S1), 其中524种单倍型为唯一分型, 1种单倍型检出3次, 6种单倍型检出2次。其中, 单倍型最多的Y-STR基因座为DYS385ab, 共有69种单倍型, 15个基因; 在基因座DYS448、DYS449、DYS481、DYS518、DYS643和DYS387S1上发现多例中间基因分型模式, 在基因座DYS387S1、DYS385ab、DYS19、DYS392、DYS438、DYS458、DYS643、DYS481和GATA-H4上发现多例多基因分型模式(中间基因和多基因分型模式已用其他商品试剂盒进行了验证)。计算得到29个Y-STR基因座的GD值(见表2)在0.3138(DYS391)至0.9656(DYS385ab)之间, 除DYS391和DYS437基因座外, 其余基因座的GD值均在0.50以上。另外, 经计算, 29个Y-STR基因座在通化地区朝鲜族人群中的HD值是0.999 940, MP值是0.001 917, DC值是0.985 158。
![]() | 表1 29个Y-STR基因座在通化地区朝鲜族人群中的等位基因频率分布(n=539) Table 1 Gene frequencies of 29 Y-STR loci from Korean-ethnic population in Tonghua area (n=539) |
![]() | 表2 29个Y-STR基因座在通化地区朝鲜族人群中的基因多样性(n=539) Table 2 Genetic diversity of 29 Y-STR loci from Korean-ethnic population in Tonghua area (n=539) |
将通化地区朝鲜族人群与北京汉族[7]、东方汉族[8]、吉林汉族[9]、乐山汉族[4]、上海汉族[10]、辽宁回族[11]、宁夏回族[12]、辽宁朝鲜族[13]、吉林满族、满洲里满族、呼伦贝尔蒙古族[14]、辽宁蒙古族[15]以及首尔韩民族人群[16]进行遗传学距离比较, 通过AMOVA分析, 获得遗传距离的Rst值矩阵(见表3)。分析发现通化朝鲜族人群与13个其他族群间的遗传距离Rst值在0.000 5~0.252 0之间, 其中通化朝鲜族与首尔韩民族群体间的遗传距离最小(0.000 5)、与吉林满族群体间的遗传距离最大(0.252 0); 从基于遗传距离构建的MDS散点图(图1)观察, 通化地区朝鲜族人群与辽宁朝鲜族、首尔韩民族汇聚为一簇, 位于左上象限。使用Mega 7.0软件应用邻接法(neighbor-joining, NJ)构建系统进化树对14个民族聚类分析, 评估各个民族之间的遗传关系。如图2所示, 通化朝鲜族与首尔韩民族汇聚后, 再与辽宁朝鲜族汇聚。
![]() | 表3 14个民族Rst值遗传距离矩阵 (n=65) Table 3 Genetic distance matrix of Rst values between 14 nationalities (n=65) |
![]() | 图1 通化地区朝鲜族人群和其他人群的MDS结果Fig.1 MDS presentation approaching to Korean-ethnic population in Tonghua area and other populations |
Y染色体是性染色体, 在人类为男性所特有。除拟常染色质区外, Y染色体的大部分在减数分裂时不会出现重组交换, 其特异基因座上的基因序列结构能够以单倍型的形式稳定地由父亲传给儿子, 呈父系遗传特征[17]。因而Y染色体常被用于性别鉴定。近些年来, 随着对Y染色体特有STR序列多态性研究的深入, Y-STR基因座被广泛用于法医DNA检案, 如男女混合样本、多个男性混合样本的检测, 以及单亲亲子鉴定等。同时因Y-STR在减数分裂过程中不发生重组, 其序列的改变仅由突变所引起, 故Y染色体遗传标记所记录的进化事件和所显示的遗传距离可能较其它遗传标记更为准确[18], 研究不同民族和地域人群Y-STR的多态性, 对了解人类的起源、迁移、基因融合、父系溯源等方面有重要的遗传学意义[19]。
本文对29个Y-STR基因座的遗传多态性作调查, 结果显示, 通化地区朝鲜族人群的HD值为0.999 940, 表明此29个Y-STR基因座在通化朝鲜族人群中联合运用具有较高的个体识别力; 29个Y-STR基因座在通化朝鲜族人群中的GD值在0.313 8~0.965 6之间, 除DYS391和DYS437这两个基因座外, 其余基因座的GD值均在0.50以上, 表明本文所用的Y-STR基因座大部分在通化朝鲜族人群中具有良好的遗传多态性, 适宜于法医学应用。另外, 在多个基因座上出现了中间基因分型和多基因分型情况, 这对法医学父系鉴定、个体识别有着重要的应用价值, 在日常法医DNA检验过程中, 若Y-STR基因座出现多基因或中间基因等特殊分型情况, 会更有利于法医学亲权鉴定[20]。基于遗传距离, 本研究选择了13个群体与通化朝鲜族人群进行遗传学聚类分析, 选择这13个民族群体是为了比对同一地域不同民族、同一民族不同地域以及不同地域不同民族间的遗传学差异, 尤其是少数民族间的遗传学差异。研究发现通化朝鲜族与首尔韩民族汇聚后与辽宁朝鲜族形成一支, 然后再陆续与吉林汉族、北京汉族汇聚在一起。中国和朝鲜半岛地缘较近, 据研究, 自商周时期即开始有华夏族裔与朝鲜民族交流融合的记载[21, 22]。遗传距离指不同的种群或种之间的基因差异的程度, 是反映群体之间遗传差异及群体遗传分化的重要指标。本研究中三个朝鲜族群体聚为一支后再与我国北方汉族人群汇聚的情况, 也从遗传学角度说明了朝鲜族的迁徙、融合。在其他群体的聚类中, 上海汉族与海南东方汉族汇聚后再与四川乐山汉族聚成一支, 说明即使同为南方汉族, 由于地域差异相互间还是存在明显差异(P< 0.05); 满洲里满族、辽宁蒙古族、宁夏回族、辽宁回族各自占据一支, 说明这四个群体更倾向于本民族内婚配, 而与其他十个人群的交流融合较少; 虽然吉林满族与呼伦贝尔蒙古族聚为一支, 但群体间的差异较显著(P< 0.05), 说明这两个群体自起源处分支进化发展后, 相互间的交流融合渐少。同时, 从结果也可以看到, 在同一地域内, 不同民族间遗传学参数存在着较大差异, 例如吉林通化朝鲜族和吉林满族遗传距离为0.252 0(P< 0.05), 说明不同民族间遗传交流较少, 遗传结构较为独立; 同一民族不同地域群体间的遗传距离也存在明显差异性, 例如吉林满族与满洲里满族遗传距离为0.130 1(P< 0.05); 但同一民族的亚群体遗传距离相对较近, 差异不明显, 例如宁夏回族与辽宁回族的遗传距离为0.002 9(P > 0.05), 此结果表明, 可能由于迁徙等原因, 同一民族群体即使处于不同地域, 其遗传距离依然较近; 而通过不同民族且不同地域群体间的遗传数据进行对比, 发现该组遗传距离较远, 比如呼伦贝尔蒙古族与辽宁朝鲜族的遗传距离为0.151 9(P< 0.05)等。这说明遗传距离与地域和民族群体都有着密不可分的联系, 尤其是在少数民族群体之间, 不同民族且不同地域间的民族群体间, 其遗传距离越远, 遗传学差异越明显。
综上所述, 通化朝鲜族人群29个Y-STR基因座的遗传多态性普遍较高, 可用于法医学个体识别和亲权关系鉴定, 本研究所获得的基因频率、多态性等数据, 可为该地区的法医学研究应用提供理论依据。同时, 通化朝鲜族人群与其他13个群体的遗传结构分析, 也为各民族的起源、迁移、融合等遗传关系研究提供了基础数据支撑。
[1] |
|
[2] |
|
[3] |
|
[4] |
|
[5] |
|
[6] |
|
[7] |
|
[8] |
|
[9] |
|
[10] |
|
[11] |
|
[12] |
|
[13] |
|
[14] |
|
[15] |
|
[16] |
|
[17] |
|
[18] |
|
[19] |
|
[20] |
|
[21] |
|
[22] |
|