基于27重SNP族群推断体系研究泰安汉、回族遗传结构
董薇1,2, 张金科1, 黄晓亮1, 张杰1, 王晓军1, 赵英健1, 朱奕卿1, 唐光峰1,*, 江丽2,*
1.泰安市公安局刑事科学技术研究所,山东 泰安 271000
2.公安部物证鉴定中心,法医遗传学公安部重点实验室,北京市现场物证检验工程技术研究中心,现场物证溯源技术国家工程实验室,北京 100038
* 通讯作者简介:唐光峰,男,山东淄博人,学士,主任法医师,研究方向为法医物证学。E-mail: 936272106@qq.com;江丽,女,安徽六安人,博士,副主任法医师,研究方向为法医遗传学。E-mail: jl@mail.bnu.edu.cn

第一作者简介:董薇,女,山东青岛人,学士,研究方向为法医物证学。E-mail: dongwei2112@163.com

摘要

目的 基于27重SNP族群推断体系对山东泰安回族、汉族进行群体遗传结构分析,评估所用体系在两民族人群中的适用性。方法 使用27重SNP族群推断荧光检测试剂盒检验泰安回、汉族各200份样本,获取27个SNP位点分型,采用DNA Ancestry Analyzer V1.0软件分析所有样本的族群成分和族群匹配概率,并基于族群的等位基因频率构建系统发育树。结果 泰安回族和汉族的族群成分均主要为东亚成分(96.5%、98.4%),但回族样本的欧洲成分(2.3%)高于汉族(0.8%);98.0%的汉族和86.5%的回族的样本被归类到东亚族群。系统发育树显示泰安回族和汉族均为东亚一支,与聚类分析结果相同。泰安回族与国内西北地区少数民族的遗传关系较泰安汉族更近;其中,泰安回族与甘肃的东乡族、回族遗传关系最近。结论 27重SNP族群推断体系检测分析揭示,同属东亚亚人群的泰安回族与汉族在欧洲成分上具有显著差异,该体系对泰安回、汉族人群间欧洲成分的差异具有较高的辨识度。

关键词: 法医遗传学; 族群推断; SNP; 泰安人群; 汉族; 回族
中图分类号:DF795.2 文献标志码:A 文章编号:1008-3650(2020)04-0348-06
Ancestry-inference 27-plex SNPs Unveiling the Genetic Structure of Han- and Hui-ethnic Population in Tai’an Area
DONG Wei1,2, ZHANG Jinke1, HUANG Xiaoliang1, ZHANG Jie1, WANG Xiaojun1, ZHAO Yingjian1, ZHU Yiqing1, TANG Guangfeng1,*, JIANG Li2,*
1. Institute of Criminal Science and Technology, Tai’an Public Security Bureau, Tai’an 271000, Shandong, China
2. Institute of Forensic Science, Ministry of Public Security (MPS) & MPS’ Key Laboratory of Forensic Genetics & Beijing Engineering Research Center of Crime Scene Evidence Examination & National Engineering Laboratory for Forensic Science, Beijing 100038, China
Abstract

Objective To analyze the genetic structure of Hui- and Han-ethnic population in Tai’an area of China’s Shandong province with the system of ancestry-inference 27-plex SNPs (AISNP27), and evaluate the applicability of the system into both the populations.Methods AISNP27 kit was used to type the 27 SNPs of each of 200 individuals from Hui-/Han-ethnic population in Tai’an area. DNA Ancestry Analyzer V1.0 was selected to analyze the ancestral components and infer the ancestry of all the tested individuals, with the phylogenetic tree being constructed based on the allele frequency of each population.Results The major ancestral components of Tai’an’s Hui- and Han-ethnic populations are of East-Asian (respective of 96.5%, 98.4%), bringing 92.2% of all the tested individuals into East-Asian clan. The European component of Tai’an’s Hui-ethnic population (2.3%) is higher than that of Tai’an’s Han-ethnic population (0.8%). The phylogenetic tree showed that Tai’an’s both Hui- and Han-ethnic populations were grouped into the East-Asian branch, similar to the result of category-clustering analysis. The genetic relationship between Tai’an’s Hui-ethnic population and northwestern China’s other national minorities is closer than that with Tai’an’s Han-ethnic population, demonstrating that Tai’an’s Hui-ethnic population is closest to Gansu’s both Dongxiang- and Hui-ethnic populations.Conclusions Ancestry-inference 27-plex SNPs unveiled that Tai’an’s Hui- and Han-ethnic populations were categorized into East-Asian clan though having significant differences in their European composition. The ancestry-inference 27-plex SNPs are highly discriminative to the different European compositions between Tai’an’s Hui- and Han-ethnic populations.

Key words: forensic genetics; ancestry inference; SNP; Tai’an population; Han- and Hui-ethnic population

族群(ethnic group)是指不仅宗教信仰、语言、风俗习惯等文化特征相同而且民族、地理渊源等更应一致的人群集合, 在人类学中特指成员或祖先具有共同的历史地理起源、血缘相同或相近的人群[1, 2, 3, 4]。在人类不同族群的基因组之间存在有遗传分布差异的多态性位点即所谓祖先信息位点(ancestry informative marker, AIM), 可被用于DNA供者的族群来源推断。当常规DNA技术没有比中数据时, 族群推断结果可以为侦查提供新线索[5, 6]。单核苷酸多态性(single nucleotide polymorphism, SNP)由于在基因组中密度高、突变率低, 成为近年来筛选AIM的重要遗传标记[7]。国外如耶鲁大学Kidd实验室、欧洲Philip实验室等分别筛选了多个位点组合, 能对3~5个洲际人群进行区分[8, 9]。我国Wei等[10]开发建立的27重SNP族群推断体系可区分来自东亚、欧洲、非洲及其混合人群的样本, 已应用于多起案件的检验鉴定[11, 12, 13, 14, 15]

泰安为山东省中西部城市, 人口以汉族为主; 少数民族则以回族居多, 始自元朝迁徙于此[16, 17]。泰安地区的汉、回族经古至今也因其他民族迁居至此而表现出不同程度的多民族混血[18, 19, 20, 21]。为进一步研究泰安地区汉、回两个族群的遗传结构并探究在该地区进行族群来源推断的可行性, 本研究利用27重SNP族群推断体系对该两个族群的遗传结构进行了检测分析。

1 材料与方法
1.1 样本DNA提取及分型检测

参考样本库包含33个人群的3 090份生物样本[22], 对照样本包含国内西北地区7个人群的818份生物样本, 测试样本包含泰安地区汉族和回族2个人群的各200份生物样本。对照与测试人群的详细信息见表1。参考和对照人群样本数据来源于国家科技资源共享服务平台计划项目。以上测试人群样本对象均已签署知情同意书, 本研究亦已通过公安部物证鉴定中心伦理委员会的伦理审查。使用Chelex-100法提取血卡DNA。根据其说明书, 以27重SNP族群推断荧光检测试剂盒(公安部物证鉴定中心研发)对提取的DNA进行检测, 74重SNP族群推断体系的分型检测参照文献[23]进行。

表1 对照人群与测试人群的样本信息 Table 1 Information from the 7 compared and 2 tested populations
1.2 数据分析

所有测试样本均采用DNA Ancestry Analyzer V1.0软件分析推断其族群来源[24]。使用STRUCYURE 2.3.4软件计算个体及群体的族群成分[25], 使用distruct1.1对族群成分结果进行可视化。使用Genepop version 4.2计算参考、对照和测试人群的Fst值(fixation index, 固定指数)[26]。使用Forensic Intelligence V1.0软件计算参考、对照和测试人群的等位基因频率[10], 使用软件phylip-3.695、MEGA7将族群间的遗传关系构建成系统发育树(phylogenetic tree)[27]

2 结果
2.1 族群成分分析

全部42个人群的27个SNP在K = 3条件下的分析结果见图1, 被分入非洲、欧洲、东亚和混合族群四组。泰安回、汉族均为东亚人群, 群体水平的东亚成分分别为93.3%和97.2%, 欧洲成分分别为4.9%和1.7%, 非洲成分分别为1.7%和1.1%。

图1 42个人群在27重SNP族群推断体系中的STRUCTURE聚类分析结果(K=3)Fig.1 STRUCTURE-clustering analysis (K=3) of 27-plex SNPs into the selected 42 populations

2.2 族群间遗传关系分析

泰安汉、回族人群在27个SNP位点的等位基因频率见表2, 由此绘制的系统发育树(见图2)反映了族群间的遗传分化程度。非洲族群(ESN、YRI等)聚成一簇; 欧洲族群(FIN、IBS等)聚成一簇; 东亚族群(CDX、KHV等)聚成一簇。泰安回(HUT)、汉(CHT)族均聚集入东亚一支, 泰安回族与国内西北地区少数民族(HUG、CYG等)的遗传关系较近, 而泰安汉族与北方汉族(CHB等)的遗传关系较近。

表2 测试人群的等位基因频率 Table 2 Allele frequencies of the 2 tested populations

图2 42个人群的系统发育树Fig.2 Phylogenetic trees out from the 42 selected populations

结合史料与相关研究中关于泰安汉族和回族的起源, 为阐明其与国内汉族人群及北方少数民族之间的关系, 本研究选择7个参考人群(4个中国西北地区的少数民族人群CTX、CUX、CKX、CZX, 3个中国汉族人群CHQ、CHB、CHS)、西北地区的其他7个对照人群(DXX、CSQ、DXG、CYG、HUB、HUG、CQH)与泰安回、汉族进行人群两两之间Fst值分析, 16个人群的Fst值结果见表3。泰安回族较之泰安汉族其与国内西北地区10个少数民族人群(CTX、CUX、CKX、CZX、DXX、CSQ、DXG、CYG、HUB、HUG)之间的Fst值均较小, 泰安汉族较之泰安回族其与国内其他地区4个汉族人群(CQH、CHQ、CHB、CHS)之间的Fst值也均较小, 该结果与系统发育树显示结果一致。

表3 16个人群的 Fst值 Table 3 Fst values of 16 selected populations
2.3 个体族群来源推断

2.3.1 个体族群成分统计

使用Structure2.3.4软件计算400份测试样本的族群成分, 利用五数归纳法(five-number summary)的统计结果见表4。基于测试样本的族群成分绘制的箱线图见图3。箱线图显示泰安回、汉族人群的族群成分存在较多的单侧离群值, 正态性检验结果显示均不符合正态分布(P< 0.05)。泰安回族的东亚成分中位数为96.5%, 95%的置信区间为[95.5%, 97.0%], 欧洲成分中位数为2.3%, 95%的置信区间为[1.8%, 2.7%]; 泰安汉族的东亚成分中位数为98.4%, 95%的置信区间为[98.2%, 98.7%], 欧洲成分中位数为0.8%, 95%的置信区间为[0.7%, 0.9%]。统计结果表明, 泰安回族的欧洲成分整体高于泰安汉族, 采用Mann-Whitney U秩和检验, 结果显示差异显著(P< 0.05)。

表4 测试样本族群成分信息统计 Table 4 Statistics of geography-oriented ancestral components of the tested individuals

图3 测试样本族群成分箱线图Fig.3 Box-plot of geography-oriented ancestral components from the tested individuals

2.3.2 似然比

结合族群匹配概率(assignment match probability, AMP)和似然比值(likelihood ratio, LR)对400份测试样本进行祖先来源推断。当似然比值大于100时, 匹配概率最高的族群为测试样本的来源族群; 当似然比值小于100时, 族群匹配概率排前两位的族群均不排除[22]。其中, 369份测试样本(173份泰安回族样本、196份泰安汉族样本)的祖先来源为东亚族群; 2份泰安回族样本(HUT093、HUT106)的祖先来源为混合族群, HUT093的东亚成分为62.9%, 欧洲成分为36.4%, HUT106的东亚成分为61.8%, 欧洲成分为37.2%; 29份测试样本(25份泰安回族样本、4份泰安汉族样本)的祖先来源不排除东亚或混合族群。

25份泰安回族样本中:1)19份样本AMP值排第一位的族群为东亚, 同时不排除来源于混合族群, 其东亚成分介于72.5%~88.2%, 欧洲成分介于4.2%~26.2%; 2)6份样本AMP值排第一位的族群为混合族群, 同时不排除来源于东亚族群, 其东亚成分介于63.9%~78.2%, 欧洲成分介于9.2%~35.6%。

4份泰安汉族样本中:1)3份样本AMP值排第一位的族群为东亚族群, 同时不排除来源于混合族群, 其东亚成分介于76.6%~82.8%, 欧洲成分介于13.4%~22.5%; 2)1份样本AMP值排第一位的族群为混合族群, 同时不排除来源于东亚族群, 其东亚成分为75.8%, 欧洲成分为22.4%。

2.3.3 主成分分析

在泰安汉族和回族中各随机选择两个样本进行主成分分析(principal component analysis, PCA), 推断其祖先来源。从图4可以看出成分1和成分2解释了58.63%的变量差异, 随机选择的四个样本均汇入东亚族群。

图4 四份测试样本的主成分分析图(HUT006、HUT166为泰安回族样本, CHT010、CHT097为泰安汉族样本)Fig.4 The principal component analysis into four randomly-selected individuals

2.4 27重SNP与74重SNP族群推断体系对比验证

为进一步验证27重SNP样本推断的准确性, 利用74重SNP族群推断体系检测2份祖先来源为混合族群的测试样本以及29份祖先来源不排除东亚或混合族群的测试样本。图5为K=3时, 31份样本的东亚成分与欧洲成分。结果显示, 在74重SNP族群推断体系中:4份泰安汉族样本的东亚成分升高, 欧洲成分降低; 27份泰安回族样本中, 12份样本(含2份祖先来源为混合族群的样本)的东亚成分升高, 欧洲成分降低; 4份样本的东亚成分升高, 欧洲成分约略降低(≤ 0.1), 11份样本的东亚和欧洲成分均基本不变。

图5 K=3时31份样本的东亚成分与欧洲成分Fig.5 East-Asian and European components of 31 individuals tested with both 27- and 74-plex SNPs ancestry-inference systems (K=3)

结合AMP和LR对31份测试样本进行祖先来源推断。2份祖先来源为混合族群的泰安回族样本(HUT093、HUT106)的验证结果为东亚族群, 其中, HUT093的东亚成分为88.6%, 欧洲成分为7.6%, HUT106的东亚成分为91.4%, 欧洲成分为7.0%。29份祖先来源不排除东亚或混合族群的测试样本中:1)4份泰安汉族样本验证结果均为东亚族群; 2)25份泰安回族样本中, 24份样本验证结果为东亚族群, 1份样本(HUT130)AMP值排第一位的族群为东亚, 同时不排除来源于混合族群(LR值为1.12), 其东亚成分为70.9%, 欧洲成分为25.1%。K=10时, 样本HUT130的北亚成分为83.2%, 太平洋成分为6.2%, 南亚成分为5.1%, AMP值排第一位的族群为北亚。

3 讨论

系统发育树(图2)显示泰安回族(HUT)和汉族(CHT)均归入东亚一支, 与聚类分析结果相同。而在对泰安回族和汉族个体进行族群成分分析时发现, 个别样本的欧洲成分占比升高, 尤其是泰安回族, 结合史料记载, 泰安地区回族的来源可能与元代蒙古军带来的中亚工匠、“ 探马赤军” 有关[17, 20], 但这还需要对泰安地区的回族及周边一带其他民族或人群进行更深入的研究分析后才能确定。Fst值(表3)显示, 相对于泰安汉族, 泰安回族与国内西北地区10个少数民族人群(CTX、CUX等)的遗传关系较近; 其中, 泰安回族与甘肃的东乡族、回族遗传关系最近。相对于泰安回族, 泰安汉族与国内其他地区4个汉族人群(CQH、CHB等)的遗传关系较近。该结果符合系统发育树(图2)中泰安回族和泰安汉族的位置情况, 亦与实际语系关系、文化特点以及历史来源[16, 17, 18, 19, 20, 21]相一致。

综上所述, 本研究结果显示:1)泰安回族与汉族均为典型的东亚人群, 泰安回族与国内西北地区少数民族的遗传关系较近; 2)27重SNP族群推断体系对泰安汉、回族人群间欧洲成分的差异具有较高的区分度, 两个人群的欧洲成分具有显著差异。在实际案件应用中, 当检测出混合族群成分的样本时, 需调研当地人口构成情况, 并进一步使用更多类型的族群推断体系(如Y-SNP等)作综合判断。

参考文献
[1] 庞中英. 族群、种族和民族[J]. 欧洲研究, 1996(6): 4-15.
(PANG Zhongying. Ethnic group, race and nationality[J]. Chinese Journal of European Studies, 1996(6): 4-15. ) [本文引用:1]
[2] 李月英. 全球化视野下的人类群体分类: 种族、民族与族群[J]. 今日民族, 2007(6): 49-53.
(LI Yueying. Classification of human groups in the perspective of globalization: race, nationality and ethnic groups[J]. Ethnic Today, 2007(6): 49-53. ) [本文引用:1]
[3] 潘蛟. “族群”及其相关概念在西方的流变[J]. 广西民族大学学报(哲学社会科学版), 2003, 25(5): 53-61.
(PAN Jiao. The permutation of “ethnic group” and the concepts related in the West[J]. Journal of Guangxi University for Nationalities (Philosophy and Social Science Edition), 2003, 25(5): 53-61. ) [本文引用:1]
[4] 周大鸣. 论族群与族群关系[J]. 广西民族大学学报(哲学社会科学版), 2001, 23(2): 13-25.
(ZHOU Daming. On the racial groups and relationship among racial groups[J]. Journal of Guangxi University for Nationalities (Philosophy and Social Science Edition), 2001, 23(2): 13-25. ) [本文引用:1]
[5] 聂昊, 林子清, 李彩霞, . DNA来源人种族推断研究进展[J]. 刑事技术, 2016, 41(1): 16-19.
(NIE Hao, LIN Ziqing, LI Caixia, et al. Inference of human race using genetic information[J]. Forensic Science and Technology, 2016, 41(1): 16-19. ) [本文引用:1]
[6] 饶旼, 李彩霞, 赵钊, . 微单倍型遗传标记及其法医遗传学应用[J]. 刑事技术, 2017, 42(4): 324-328.
(RAO Min, LI Caixia, ZHAO Zhao, et al. Microhaplotypic genetic markers and their applications in forensic genetics[J]. Forensic Science and Technology, 2017, 42(4): 324-328. ) [本文引用:1]
[7] 侯光伟, 刘利民, 姜先华, . 常染色体21个SNPs多态性分型方法研究[J]. 中国法医学杂志, 2010, 25(4): 249-252.
(HOU Guangwei, LIU Limin, JIANG Xianhua, et al. Study on genotyping method of a 21-locus autosomal SNP multiplex[J]. Chinese Journal of Forensic Medicine, 2010, 25(4): 249-252. ) [本文引用:1]
[8] PHILLIPS C. Forensic genetic analysis of bio-geographical ancestry[J]. Forensic Science International: Genetics, 2015, 18: 49-65. [本文引用:1]
[9] KIDD K K, SPEED W C, PAKSTIS A J, et al. Progress toward an efficient panel of SNPs for ancestry inference[J]. Forensic Science International: Genetics, 2014, 10: 23-32. [本文引用:1]
[10] WEI Y L, WEI L, ZHAO L, et al. A single-tube 27-plex SNP assay for estimating individual ancestry and admixture from three continents[J]. International Journal of Legal Medicine, 2016, 130(1): 27-37. [本文引用:2]
[11] 孙启凡, 赵蕾, 孙敬, . 利用SNP复合扩增技术推断骨骼所属人种1例[J]. 中国法医学杂志, 2015, 30(2): 194-195.
(SUN Qifan, ZHAO Lei, SUN Jing, et al. One case of human race deduced from bones using SNP composite amplification[J]. Chinese Journal of Forensic Medicine, 2015, 30(2): 194-195. ) [本文引用:1]
[12] SUN Q, JIANG L, ZHANG G, et al. Twenty-seven continental ancestry-informative SNP analysis of bone remains to resolve a forensic case[J]. Forensic Sciences Research, 2019, 4(4): 364-366. [本文引用:1]
[13] 王敬方, 江丽, 江继平, . 基于27-plex SNPs的四川地区四个族群遗传推断研究[J]. 中国法医学杂志, 2019, 34(2): 120-124.
(WANG Jingfang, JIANG Li, JIANG Jiping, et al. Genetic inference study of four populations in Sichuan province by 27-plex SNPs[J]. Chinese Journal of Forensic Medicine, 2019, 34(2): 120-124. ) [本文引用:1]
[14] 张涛, 冯保强, 周浩, . 27重SNP种族推断体系在案件中的应用[J]. 刑事技术, 2019, 44(3): 276-279.
(ZHANG Tao, FENG Baoqiang, ZHOU Hao, et al. Application of 27-plex SNP race inference assay into tracing a suspect’s ethnogenesis: case report[J]. Forensic Science and Technology, 2019, 44(3): 276-279. ) [本文引用:1]
[15] 杨鑫, 江丽, 骆继怀, . 基于27重SNP种族推断体系的东乡族群体遗传结构研究[J]. 刑事技术, 2019, 44(2): 117-121
(YANG Xin, JIANG Li, LUO Jihuai, et al. Genetic structure of China’s Dongxiang-ethnic population based on continental ancestry-informative 27-plex SNPs[J]. Forensic Science and Technology, 2019, 44(2): 117-121. ) [本文引用:1]
[16] 周郢. 泰安回族士人与泰山文化[J]. 中国穆斯林, 2014(2): 60-63.
(ZHOU Ying. Tai’an Hui-ethnic scholars and Taishan culture[J]. China’s Muslim, 2014(2): 60-63. ) [本文引用:2]
[17] 金坡. 泰安芝田村清真寺考略[J]. 泰山学院学报, 2010, 32(4): 22-27.
(JIN Po. Research on Tai’an’s Zhitian village mosque[J]. Journal of Taishan University, 2010, 32(4): 22-27. ) [本文引用:3]
[18] 陈连开. 中国民族史纲要[M]. 北京: 中国财政经济出版社, 1999.
(CHEN Liankai. Outline of Chinese national history[M]. Beijing: Chinese Financial & Economic Publishing House, 1999. ) [本文引用:2]
[19] 程有为, 吴少珉. 论魏晋南北朝时期中原地区的民族问题[J]. 许昌学院学报, 1996(1): 15-20.
(CHENG Youwei, WU Shaomin. On the ethnic problems in the Central Plains during the Wei, Jin, Southern and Northern Dynasties[J]. Journal of Xuchang University, 1996(1): 15-20. ) [本文引用:2]
[20] 丁乐春. 山东回族的今昔[J]. 宁夏社会科学, 1986(4): 16-21.
(DING Lechun. Past and present of Shand ong Hui population[J]. Social Sciences in Ningxia, 1986(4): 16-21. ) [本文引用:3]
[21] 马恩惠. 山东部分回族族源问题探索[J]. 宁夏社会科学, 1991(4): 43-49.
(MA Enhui. A probe into the source of some Hui nationalities in Shand ong[J]. Social Sciences in Ningxia, 1991(4): 43-49. ) [本文引用:2]
[22] 江丽, 孙启凡, 马泉, . 27-plex SNP 种族推断方法的优化及验证[J]. 遗传, 2017, 39(2): 166-173.
(JIANG Li, SUN Qifan, MA Quan, et al. Optimization and validation of analysis method based on 27-plex SNP panel for ancestry inference[J]. Hereditas (Beijing), 2017, 39(2): 166-173. ) [本文引用:2]
[23] LI C X, PAKSTIS A J, JIANG L, et al. A panel of 74 AISNPs: improved ancestry inference within Eastern Asia[J]. Forensic Science International: Genetics, 2016, 23: 101-110. [本文引用:1]
[24] 刘京, 李盛, 江丽, . 对于未知来源个体进行族群推断的自动分析系统[J]. 生命科学研究, 2018, 22(1): 3-7.
(LIU Jing, LI Sheng, JIANG Li, et al. DNA ancestry analyzer: an automatic program for ancestry inference of unknown individuals[J]. Life Science Research, 2018, 22(1): 3-7. ) [本文引用:1]
[25] FALUSH D, STEPHENS M, PRITCHARD J K. Inference of population structure using multilocus genotype data: dominant markers and null alleles[J]. Molecular Ecology Notes, 2007, 7(4): 574-578. [本文引用:1]
[26] ROUSSET F. Genepop’007: a complete re-implementation of the genepop software for Windows and Linux[J]. Molecular Ecology Resources, 2008, 8(1): 103-106. [本文引用:1]
[27] TUIMALA J, EDITION F. A primer to phylogenetic analysis using the PHYLIP package[J]. Espoo, Finland : CSC-Seientific Computing Ltd, 2006. [本文引用:1]