引用本文

王玮, 赵蕾, 江丽, 刘京, 黄美莎, 李冉冉, 刘佳佳, 马泉, 王英元, 李彩霞. 用于中国人群个体识别的InDel多重PCR系统的构建[J].刑事技术, 2017,42(1):1-8
WANG Wei, ZHAO Lei, JIANG Li, LIU Jing, HUANG Meisha, LI Ranran, LIU Jiajia, MA Quan, WANG Yingyuan, LI Caixia. Constructing a Multiplex PCR System for Personal Identification by the InDel Polymorphism of Chinese Population[J].
Forensic Science and Technology,2017,42(1): 1-8
Permissions
Copyright©2017, 《刑事技术》编辑部
《刑事技术》编辑部
* 通讯作者:李彩霞(1976—),女,山西临汾人,博士,主任法医师,研究方向为法医遗传学。E-mail:
licaixia@tsinghua.org.cn
第一作者简介:王玮(1988—),女,山西太原人,硕士研究生,研究方向为法医遗传学。E-mail:wang.wei614@163.com
基金资助: 中央级公益性科研院所基本科研业务费专项资金项目(No. 2014JB010)
中图分类号:DF795.2
文献标志码:A
文章编号:1008-3650(2017)01-0001-08
Constructing a Multiplex PCR System for Personal Identification by the InDel Polymorphism of Chinese Population
插入– 缺失多态性(Insertion-Deletion, InDel), 是一段DNA片段因插入或缺失所形成的特殊类型的二等位基因多态性。相对于STR与SNP, InDel的特点有:a.广泛分布在整个基因组中[1, 2]; b.缘于突变且频率低, 发生后较稳定, 不易再突变[3]; c.可作为始祖信息位点判断地域来源[1, 4]; d.可在较小的扩增子中扩增, 适用于降解DNA的检测[1, 2]; e.可利用法医DNA实验室现有的仪器设备进行基因分型; f.能同时用于自动化和高通量的技术[1, 2]。因此, InDel愈益受到关注, 且已有多位学者建立了适用于本民族多态性研究的复合体系[5, 6, 7]。本研究采用五色荧光毛细管电泳技术, 并使用国产扩增试剂缓冲液体系, 建立一套可用于鉴定中国人群的法医DNA复合扩增体系。
1 材料与方法1.1 InDel位点筛选依据美国国家生物信息中心(National Center for Biotechnology Information, NCBI), 并结合现有文献报道[6, 8-12], 选择InDel位点:插入或缺失的碱基介于2~30bp之间, 位于内含子区域, 在SNP数据库(SNP database, dbSNP)中该InDel位点的最低等位基因频率(Minor Allele Frequency, MAF)大于0.2、杂合度大于等于0.4, 在不同人群间等位基因频率差别小(FST值< 0.06)[13], 散布于22条染色体上, 同一染色体上InDel位点间距不小于5MB[5], 在中国汉族人群中的分布符合Hardy-Weinberg遗传平衡。按照以上标准筛选出符合要求的83个位点, 挑选中国不同民族的检验样本, 以Sequenom方法对83个位点进行检测, 得到分型信息, 计算等位基因频率、期望杂合度、Hardy-Weinberg以及连锁平衡性信息等, 最终确定30个InDel位点用于复合扩增。此30个位点仅用于法医学个体识别, 未见与医疗敏感信息相关联的文献报道。
1.2 样本制备根据知情同意原则, 采集421份无关个体的新鲜外周静脉血样, 其中北京汉族94份, 云南傣族97份, 新疆哈萨克族95份, 广西苗、瑶族各69、66份。按照QIAamp® DNA Blood Midi Kit说明书(Qiagen, 德国)提取血样DNA。所有DNA均经Nanodrop2000c(Thermo Scientific, 美国)定量, 用超纯水稀释为0.5~1.0 ng/μ L待用。
1.3 主要试剂与仪器2× MasterMix、人类标准品(9947A, 1ng/μ L)、分子量内标Typer500(公安部物证鉴定中心), POP7电泳凝胶、去离子甲酰胺(美国AB公司), 荧光标记PCR引物(上海生工)。9700型PCR仪、3130xL遗传分析仪(美国AB公司)。
1.4 五色荧光标记多重PCR扩增体系采用Primer premier 5.0设计30个InDel位点及Amelogenin性别基因座的PCR引物, 分别采用FAM、HEX、TAMERA和ROX荧光素标记, 以9947A为模板进行PCR扩增。多重PCR扩增体系为10.0 μ L(2× MasterMix 5.0μ L, PrimerMix 4.0 μ L, 模板DNA 1.0 μ L), 扩增条件为95 ℃、11min; 94 ℃、30 s, 60 ℃、120 s, 72 ℃、90 s, 共30个循环; 60 ℃延伸60 min。
1.5 五色荧光标记多重PCR扩增体系分析方法的建立五色荧光标记多重PCR扩增体系经3130xL遗传分析仪电泳后, 采用美国AB公司GeneMapper v3.2软件进行结果分析。将所选择的InDel位点以9947A为模板进行单位点扩增, 通过毛细管电泳和软件分析得到每个位点的遗传参数, 按照软件说明书, 制作适用于本研究的Panel文件、bin文件及方法文件。
1.6 统计分析利用Modified-Power states软件包[14]计算各个位点的等位基因频率(Allelic Frequency, AF)、个体识别率(Discrimination power, DP)、期望杂合度(Expected heterozygosity, He)、非父排除概率(Power of Exclusion, PE)、匹配概率(Matching Probability, MP)、累积个体识别率(Cumulative Discrimination Power, CDP)、累积非父排除概率(Cumulative Probability of Exclusion, CPE)及随机匹配概率(Random Matching Probability, RMP)。同一染色体上各位点的连锁不平衡分析采用Haploview 4.2[15]计算, InDel各位点的Hardy-Weinberg平衡检验、FST遗传距离及汉族与其他民族之间等位基因频率的Fisher精确概率检验采用GenePop V4.2[16] (http://www.genepop.curtin.edu.au)计算, 利用Arlequin 3.5[17]做分子方差分析(analysis of molecular variance, AMOVA)。
2 结果2.1 多重PCR体系的建立利用1.1方法所筛选出的30个位点及一个Amelogenin基因座构建多重PCR体系, 其中Amelogenin基因座为性别鉴定基因座, 命名为X与Y, 即在X与Y染色体上, 在本体系的扩增子中相差6bp。30个InDel位点信息见表1。利用复合扩增体系检验9947A的分型(图1)。
表1
Table 1
表1(Table 1)
 表1 30个插入– 缺失多态位点信息 Table 1 Details of the selected 30 InDel markers序号 | 标签 | rs#1) | 染色体 | 物理位置2) | SNP to CHR | Insertion (1)/Deletion (0)3) | 9947A基因型 |
---|
1 | 8 | rs10629077 | chr21 q21.3 | 30000019:30000020 | F | AT/- | 0, 0 | 2 | 64 | rs2308026 | chr4 q26 | 118264250:118264251 | F | CA/- | 0, 1 | 3 | 19 | rs361519 | chr6 p24.3 | 7281221:7281223 | F | AGG/- | 0, 1 | 4 | 24 | rs2307652 | chr6 q16.1 | 97010245:97010246 | F | AAGC/AGCA/- | 1, 1 | 5 | 71 | rs16671 | chr20 p12.2 | 9518907:9518908 | R | CC/CCC(3)/- | 0, 1 | 6 | 65 | rs33948716 | chr4 q28.1 | 122853658:122853660 | F | CCT/- | 1, 1 | 7 | 5 | rs8190570 | chr9 q22.32 | 96235629:96235637 | R | CCACAAAGA/- | 0, 0 | 8 | 17 | rs1610937 | chr5 q13.3 | 77449242:77449245 | F | AGGA/- | 1, 1 | 9 | 14 | rs2307689 | chr19 q13.31 | 43700188:43700190 | F | TTC/- | 0, 0 | 10 | 22 | rs2307976 | chr11 p13 | 35125786:35125787 | R | GAA/- | 0, 1 | 11 | 25 | rs1305056 | chr5 q33.2 | 156235246:156235247 | F | CTACTGAC/- | 1, 1 | 12 | 23 | rs2067353 | chr5 q22.1 | 110438189:110438190 | F | ATTTT/- | 0, 0 | 13 | 66 | rs1610963 | chr5 q22.2 | 112911386:112911387 | R | ATAACTAA/- | 0, 0 | 14 | 32 | rs2307632 | chr17 q21.32 | 49240156:49240158 | R | GAA/- | 0, 1 | 15 | 20 | rs17878444 | chr1 p22.1 | 91772335:91772336 | R | CCTAAACAAAAATGGGAT/- | 0, 0 | 16 | 62 | rs140847 | chr9 p23 | 12617325:12617328 | R | CGTT/- | 1, 1 | 17 | 31 | rs2307554 | chr5 p13.2 | 35619871:35619872 | F | AGAATGACTTCATTCTG/- | 0, 0 | 18 | 33 | rs2308020 | chr15 q21.3 | 53189318:53189319 | R | TT/- | 0, 1 | 19 | 30 | rs1610902 | chr16 p13.3 | 2150621:2150622 | F | GTCTGGGGAGCTGTT/GTCTGG GGAGCTGTTCTCTACCCC(3)/- | 0, 0 | 20 | 11 | rs2307839 | chr6 q22.1 | 116772391:116772392 | R | GA/- | 0, 1 | 21 | 77 | rs2307708 | chr2 q22.1 | 140309928:140309929 | R | AG/GA/- | 0, 1 | 22 | 29 | rs2308115 | chr6 p24.1 | 11957746:11957747 | F | TGA/- | 1, 1 | 23 | 12 | rs3047269 | chr1 q23.3 | 162841038:162841039 | R | CTGA/- | 0, 1 | 24 | 15 | rs2067294 | chr9 q21.11 | 68699505:68699506 | F | CTT/- | 1, 1 | 25 | 78 | rs2307553 | chr14 q31.1 | 79655347:79655348 | F | TGAC/- | 0, 1 | 26 | 75 | rs16438 | chr20 p11.21 | 25297829:25297830 | R | CCCAC/CCCCA/- | 0, 0 | 27 | 37 | rs2307981 | chr3 p25.2 | 12022928:12022929 | R | TTG/- | 0, 1 | 28 | 79 | rs4646006 | chr1 p36.21 | 15518527:15518528 | R | CTCA/- | 0, 1 | 29 | 67 | rs2308072 | chr8 p21.3 | 19232269:19232270 | F | AAGG/- | 0, 1 | 30 | 3 | rs140864 | chr1 p34.3 | 35926061:35926063 | R | TTC/- | 1, 1 |
注:1) rs#为相应InDel位点在dbSNP数据库的登录号(下同); 2)为InDel位点在相应染色体上的物理位置, 人类基因组数据库的版本号为GRCh38.p2; 3)Insertion在本体系中命名为等位基因1, Deletion命名为等位基因0 | 表1 30个插入– 缺失多态位点信息 Table 1 Details of the selected 30 InDel markers |
2.2 各InDel位点在不同民族中的等位基因频率及其分布差异30个InDel位点在汉族、哈萨克族、傣族、苗和瑶族的等位基因频率及各位点的FST值见表2。经Fisher精确概率检验比较汉族与哈萨克族、汉族与傣族、汉族与苗族以及汉族与瑶族等位基因频率的差异, 其中有14个位点有统计学意义, 在表2中用粗体显示(p < 0.0125, 经Bonferroni校正)。AMOVA结果表明在群体间的差异为2.3 %, 即97.7 %的差异来自群体内。群体间两两比较的FST遗传距离见表3。
表2
Table 2
表2(Table 2)
 表2 30个插入– 缺失多态位点在5个民族中等位基因的频率 Table 2 Allelic frequencies of 30 InDel markers in five ethnic populations标签 | rs# | 汉族(2n=188) | 哈萨克族(2n=190) | 傣族(2n=194) | 苗族(2n=138) | 瑶族(2n=132) | FST |
---|
f0 | f0 | f0 | f2 | f0 | f2 | f0 | f2 |
---|
8 | rs10629077 | 0.245 | 0.237 | 0.263 | – | 0.225 | – | 0.174 | – | 0.005 | 64 | rs2308026 | 0.160 | 0.247 | 0.289 | – | 0.254 | – | 0.318 | – | 0.015 | 19 | rs361519 | 0.415 | 0.447 | 0.351 | – | 0.457 | – | 0.424 | – | 0.006 | 24 | rs2307652 | 0.484 | 0.426 | 0.407 | – | 0.449 | – | 0.477 | – | 0.003 | 71 | rs16671 | 0.431 | 0.416 | 0.371 | – | 0.428 | – | 0.356 | – | 0.004 | 65 | rs33948716 | 0.096 | 0.158 | 0.098 | – | 0.094 | – | 0.136 | – | 0.007 | 5 | rs8190570 | 0.394 | 0.400 | 0.443 | – | 0.449 | – | 0.462 | – | 0.003 | 17 | rs1610937 | 0.596 | 0.589 | 0.433 | – | 0.493 | – | 0.402 | – | 0.025 | 14 | rs2307689 | 0.324 | 0.442 | 0.33 | – | 0.304 | – | 0.455 | – | 0.018 | 22 | rs2307976 | 0.452 | 0.674 | 0.536 | – | 0.522 | – | 0.508 | – | 0.022 | 25 | rs1305056 | 0.303 | 0.411 | 0.253 | – | 0.312 | – | 0.288 | – | 0.013 | 23 | rs2067353 | 0.654 | 0.711 | 0.474 | – | 0.500 | – | 0.561 | – | 0.033 | 66 | rs1610963 | 0.569 | 0.632 | 0.582 | – | 0.59 | – | 0.688 | – | 0.008 | 32 | rs2307632 | 0.745 | 0.516 | 0.722 | – | 0.724 | – | 0.773 | – | 0.040 | 20 | rs17878444 | 0.569 | 0.632 | 0.582 | – | 0.59 | – | 0.688 | – | 0.008 | 62 | rs140847 | 0.745 | 0.516 | 0.722 | – | 0.724 | – | 0.773 | – | 0.040 | 31 | rs2307554 | 0.771 | 0.774 | 0.845 | – | 0.87 | – | 0.803 | – | 0.010 | 30 | rs2308020 | 0.043 | 0.047 | 0.067 | 0.046 | 0.007 | 0.007 | 0 | 0.098 | 0.020 | 33 | rs1610902 | 0.59 | 0.584 | 0.603 | – | 0.007 | – | 0.538 | – | 0.212 | 11 | rs2307839 | 0.479 | 0.437 | 0.428 | – | 0.384 | – | 0.371 | – | 0.006 | 77 | rs2307708 | 0.694 | 0.632 | 0.567 | – | 0.572 | – | 0.629 | – | 0.009 | 29 | rs2308115 | 0.202 | 0.163 | 0.165 | – | 0.246 | – | 0.167 | – | 0.007 | 12 | rs3047269 | 0.596 | 0.632 | 0.649 | – | 0.572 | – | 0.667 | – | 0.005 | 15 | rs2067294 | 0.213 | 0.232 | 0.237 | – | 0.188 | – | 0.152 | – | 0.006 | 78 | rs2307553 | 0.548 | 0.637 | 0.577 | – | 0.565 | – | 0.621 | – | 0.005 | 75 | rs16438 | 0.048 | 0.321 | 0.098 | – | 0.109 | – | 0.098 | – | 0.078 | 37 | rs2307981 | 0.452 | 0.316 | 0.222 | – | 0.29 | – | 0.258 | – | 0.029 | 79 | rs4646006 | 0.309 | 0.474 | 0.284 | – | 0.312 | – | 0.348 | – | 0.020 | 67 | rs2308072 | 0.713 | 0.658 | 0.66 | – | 0.536 | – | 0.674 | – | 0.016 | 3 | rs140864 | 0.67 | 0.479 | 0.619 | – | 0.601 | – | 0.598 | – | 0.016 |
注:f0为等位基因Deletion(0)的频率, f2为30号引物第二段插入片段的频率; 粗体的等位基因频率为频率所对应的人群与汉族人群的分布差异经Fisher精确概率检验有统计学意义(P< 0.0125, 经Bonferroni校正) | 表2 30个插入– 缺失多态位点在5个民族中等位基因的频率 Table 2 Allelic frequencies of 30 InDel markers in five ethnic populations |
表3
Table 3
表3(Table 3)
 表3 5个民族之间两两比较的FST遗传距离 Table 3 Pairwise genetic distances estimated by FST values between five ethnic populations | 瑶族 | 苗族 | 傣族 | 哈萨克族 |
---|
苗族 | 0.0258 | | | | 傣族 | 0.0020 | 0.0279 | | | 哈萨克族 | 0.0215 | 0.0448 | 0.0238 | | 汉族 | 0.0119 | 0.0337 | 0.0106 | 0.0243 |
| 表3 5个民族之间两两比较的FST遗传距离 Table 3 Pairwise genetic distances estimated by FST values between five ethnic populations |
2.3 30个InDel位点在不同民族的平衡检验经Bonferroni校正, Hardy-Weinberg平衡检验, 30个InDel位点在各民族中均达到遗传平衡。在同一染色体上的InDel位点, 两两计算r2值, 均小于0.02, 互不连锁, 符合连锁平衡检验。
2.4 各InDel位点在不同民族中的法医学参数在不同民族中的个体识别率DP、杂合度He及累积个体识别率CDP见表4, 非父排除概率PE、累积非父排除概率CPE、匹配概率MP及随机匹配概率RMP见表5。
表4
Table 4
表4(Table 4)
 表4 30个位点在各民族中的DP和He值 Table 4 Both DP and He values of 30 InDel markers in five ethnic populations标签 | rs# | 汉族 | | 哈萨克族 | | 傣族 | | 苗族 | | 瑶族 |
---|
DP | He | | DP | He | | DP | He | | DP | He | | DP | He |
---|
8 | rs10629077 | 0.536 | 0.319 | | 0.523 | 0.389 | | 0.542 | 0.423 | | 0.515 | 0.333 | | 0.454 | 0.318 | 64 | rs2308026 | 0.420 | 0.234 | | 0.534 | 0.389 | | 0.568 | 0.412 | | 0.544 | 0.362 | | 0.551 | 0.515 | 19 | rs361519 | 0.580 | 0.553 | | 0.652 | 0.411 | | 0.600 | 0.454 | | 0.537 | 0.623 | | 0.621 | 0.485 | 24 | rs2307652 | 0.613 | 0.521 | | 0.641 | 0.432 | | 0.615 | 0.485 | | 0.646 | 0.435 | | 0.638 | 0.470 | 71 | rs16671 | 0.647 | 0.415 | | 0.623 | 0.474 | | 0.594 | 0.495 | | 0.594 | 0.536 | | 0.584 | 0.500 | 65 | rs33948716 | 0.310 | 0.191 | | 0.423 | 0.253 | | 0.284 | 0.134 | | 0.306 | 0.188 | | 0.380 | 0.212 | 5 | rs8190570 | 0.585 | 0.532 | | 0.591 | 0.526 | | 0.630 | 0.474 | | 0.591 | 0.551 | | 0.655 | 0.409 | 17 | rs1610937 | 0.636 | 0.426 | | 0.625 | 0.463 | | 0.636 | 0.454 | | 0.628 | 0.493 | | 0.606 | 0.500 | 14 | rs2307689 | 0.579 | 0.202 | | 0.650 | 0.253 | | 0.585 | 0.206 | | 0.575 | 0.232 | | 0.640 | 0.212 | 22 | rs2307976 | 0.567 | 0.585 | | 0.562 | 0.505 | | 0.642 | 0.454 | | 0.527 | 0.638 | | 0.650 | 0.439 | 25 | rs1305056 | 0.536 | 0.521 | | 0.552 | 0.589 | | 0.541 | 0.381 | | 0.550 | 0.507 | | 0.564 | 0.424 | 23 | rs2067353 | 0.603 | 0.436 | | 0.557 | 0.453 | | 0.590 | 0.557 | | 0.635 | 0.478 | | 0.610 | 0.515 | 66 | rs1610963 | 0.615 | 0.500 | | 0.549 | 0.568 | | 0.598 | 0.526 | | 0.558 | 0.582 | | 0.588 | 0.406 | 32 | rs2307632 | 0.539 | 0.404 | | 0.641 | 0.463 | | 0.554 | 0.433 | | 0.552 | 0.433 | | 0.517 | 0.328 | 20 | rs17878444 | 0.615 | 0.500 | | 0.549 | 0.568 | | 0.598 | 0.526 | | 0.558 | 0.582 | | 0.588 | 0.406 | 62 | rs140847 | 0.539 | 0.404 | | 0.641 | 0.463 | | 0.554 | 0.433 | | 0.552 | 0.433 | | 0.517 | 0.328 | 31 | rs2307554 | 0.517 | 0.372 | | 0.516 | 0.305 | | 0.427 | 0.309 | | 0.386 | 0.261 | | 0.483 | 0.333 | 30 | rs2308020 | 0.102 | 0.021 | | 0.156 | 0.074 | | 0.363 | 0.206 | | 0.057 | 0.029 | | 0.267 | 0.106 | 33 | rs1610902 | 0.627 | 0.457 | | 0.623 | 0.474 | | 0.620 | 0.464 | | 0.029 | 0.014 | | 0.636 | 0.470 | 11 | rs2307839 | 0.619 | 0.511 | | 0.597 | 0.537 | | 0.622 | 0.485 | | 0.578 | 0.536 | | 0.592 | 0.500 | 77 | rs2307708 | 0.589 | 0.376 | | 0.576 | 0.526 | | 0.608 | 0.515 | | 0.636 | 0.449 | | 0.606 | 0.470 | 29 | rs2308115 | 0.380 | 0.064 | | 0.283 | 0.011 | | 0.314 | 0.041 | | 0.371 | 0.000 | | 0.333 | 0.061 | 12 | rs3047269 | 0.621 | 0.468 | | 0.598 | 0.484 | | 0.607 | 0.433 | | 0.625 | 0.478 | | 0.577 | 0.485 | 15 | rs2067294 | 0.498 | 0.383 | | 0.522 | 0.358 | | 0.523 | 0.392 | | 0.470 | 0.290 | | 0.422 | 0.303 | 78 | rs2307553 | 0.646 | 0.436 | | 0.567 | 0.537 | | 0.633 | 0.454 | | 0.633 | 0.464 | | 0.615 | 0.455 | 75 | rs16438 | 0.173 | 0.096 | | 0.594 | 0.411 | | 0.284 | 0.134 | | 0.280 | 0.101 | | 0.245 | 0.076 | 37 | rs2307981 | 0.620 | 0.500 | | 0.599 | 0.337 | | 0.511 | 0.320 | | 0.578 | 0.348 | | 0.537 | 0.424 | 79 | rs4646006 | 0.574 | 0.447 | | 0.631 | 0.484 | | 0.569 | 0.381 | | 0.596 | 0.333 | | 0.553 | 0.545 | 67 | rs2308072 | 0.557 | 0.447 | | 0.612 | 0.389 | | 0.586 | 0.474 | | 0.661 | 0.377 | | 0.578 | 0.470 | 3 | rs140864 | 0.596 | 0.426 | | 0.636 | 0.474 | | 0.599 | 0.495 | | 0.626 | 0.449 | | 0.630 | 0.439 | | 平均值 | 0.535 | 0.392 | | 0.561 | 0.420 | | 0.547 | 0.398 | | 0.513 | 0.385 | | 0.541 | 0.387 | | CDP | 0.999999999957 | | 0.999999999990 | | 0.999999999974 | | 0.999999999875 | | 0.999999999966 |
| 表4 30个位点在各民族中的DP和He值 Table 4 Both DP and He values of 30 InDel markers in five ethnic populations |
表5
Table 5
表5(Table 5)
 表5 30个位点在各民族中的MP和PE值 Table 5 Both MP and PE values of 30 InDel markers in five ethnic populations标签 | rs# | 汉族 | | 哈萨克族 | | 傣族 | | 苗族 | | 瑶族 |
---|
MP | PE | | MP | PE | | MP | PE | | MP | PE | | MP | PE |
---|
8 | rs10629077 | 0.464 | 0.072 | | 0.477 | 0.108 | | 0.458 | 0.128 | | 0.485 | 0.078 | | 0.546 | 0.071 | 64 | rs2308026 | 0.580 | 0.040 | | 0.466 | 0.108 | | 0.432 | 0.122 | | 0.456 | 0.093 | | 0.449 | 0.201 | 19 | rs361519 | 0.420 | 0.238 | | 0.348 | 0.120 | | 0.400 | 0.150 | | 0.463 | 0.320 | | 0.379 | 0.175 | 24 | rs2307652 | 0.387 | 0.207 | | 0.359 | 0.134 | | 0.385 | 0.174 | | 0.354 | 0.137 | | 0.362 | 0.162 | 71 | rs16671 | 0.353 | 0.123 | | 0.377 | 0.165 | | 0.406 | 0.183 | | 0.406 | 0.221 | | 0.416 | 0.188 | 65 | rs33948716 | 0.690 | 0.027 | | 0.577 | 0.046 | | 0.716 | 0.014 | | 0.694 | 0.027 | | 0.620 | 0.033 | 5 | rs8190570 | 0.415 | 0.217 | | 0.409 | 0.212 | | 0.370 | 0.166 | | 0.409 | 0.236 | | 0.345 | 0.120 | 17 | rs1610937 | 0.364 | 0.130 | | 0.375 | 0.157 | | 0.364 | 0.150 | | 0.372 | 0.181 | | 0.394 | 0.188 | 14 | rs2307689 | 0.421 | 0.030 | | 0.350 | 0.046 | | 0.415 | 0.031 | | 0.425 | 0.039 | | 0.360 | 0.033 | 22 | rs2307976 | 0.433 | 0.273 | | 0.438 | 0.192 | | 0.358 | 0.150 | | 0.473 | 0.339 | | 0.350 | 0.140 | 25 | rs1305056 | 0.464 | 0.207 | | 0.448 | 0.278 | | 0.459 | 0.103 | | 0.450 | 0.194 | | 0.436 | 0.129 | 23 | rs2067353 | 0.397 | 0.137 | | 0.443 | 0.149 | | 0.410 | 0.242 | | 0.365 | 0.169 | | 0.390 | 0.201 | 66 | rs1610963 | 0.385 | 0.188 | | 0.451 | 0.255 | | 0.402 | 0.211 | | 0.442 | 0.270 | | 0.412 | 0.118 | 32 | rs2307632 | 0.461 | 0.117 | | 0.359 | 0.157 | | 0.446 | 0.135 | | 0.448 | 0.135 | | 0.483 | 0.076 | 20 | rs17878444 | 0.385 | 0.188 | | 0.451 | 0.255 | | 0.402 | 0.211 | | 0.442 | 0.270 | | 0.412 | 0.118 | 62 | rs140847 | 0.461 | 0.117 | | 0.359 | 0.157 | | 0.446 | 0.135 | | 0.448 | 0.135 | | 0.483 | 0.076 | 31 | rs2307554 | 0.483 | 0.098 | | 0.484 | 0.066 | | 0.573 | 0.067 | | 0.614 | 0.049 | | 0.517 | 0.078 | 33 | rs2308020 | 0.898 | 0.000 | | 0.844 | 0.005 | | 0.637 | 0.031 | | 0.943 | 0.001 | | 0.733 | 0.009 | 30 | rs1610902 | 0.373 | 0.153 | | 0.377 | 0.165 | | 0.380 | 0.158 | | 0.971 | 0.000 | | 0.364 | 0.162 | 11 | rs2307839 | 0.381 | 0.197 | | 0.403 | 0.222 | | 0.378 | 0.174 | | 0.422 | 0.221 | | 0.408 | 0.188 | 77 | rs2307708 | 0.411 | 0.100 | | 0.424 | 0.212 | | 0.392 | 0.201 | | 0.364 | 0.147 | | 0.394 | 0.162 | 29 | rs2308115 | 0.620 | 0.004 | | 0.717 | 0.000 | | 0.686 | 0.002 | | 0.629 | 0.000 | | 0.667 | 0.003 | 12 | rs3047269 | 0.379 | 0.161 | | 0.402 | 0.174 | | 0.393 | 0.135 | | 0.375 | 0.169 | | 0.423 | 0.175 | 15 | rs2067294 | 0.502 | 0.104 | | 0.478 | 0.090 | | 0.477 | 0.109 | | 0.530 | 0.059 | | 0.578 | 0.065 | 78 | rs2307553 | 0.354 | 0.137 | | 0.433 | 0.222 | | 0.367 | 0.150 | | 0.367 | 0.158 | | 0.385 | 0.151 | 75 | rs16438 | 0.827 | 0.008 | | 0.406 | 0.120 | | 0.716 | 0.014 | | 0.720 | 0.009 | | 0.755 | 0.005 | 37 | rs2307981 | 0.380 | 0.188 | | 0.401 | 0.080 | | 0.489 | 0.072 | | 0.422 | 0.085 | | 0.463 | 0.129 | 79 | rs4646006 | 0.426 | 0.145 | | 0.369 | 0.174 | | 0.431 | 0.103 | | 0.404 | 0.078 | | 0.447 | 0.230 | 67 | rs2308072 | 0.443 | 0.145 | | 0.388 | 0.108 | | 0.414 | 0.166 | | 0.339 | 0.100 | | 0.422 | 0.162 | 3 | rs140864 | 0.404 | 0.130 | | 0.364 | 0.165 | | 0.401 | 0.183 | | 0.374 | 0.147 | | 0.370 | 0.140 | | CPE | 0.985806214404 | | 0.991703261452 | | 0.985349899681 | | 0.989454441374 | | 0.981878316634 | | RMP | 4.291E-11 | | | 9.829E-12 | | | 2.600E-11 | | | 1.248E-10 | | | 3.401E-11 | |
| 表5 30个位点在各民族中的MP和PE值 Table 5 Both MP and PE values of 30 InDel markers in five ethnic populations |
3 讨论插入– 缺失多态性遗传标记兼具STR(Short tandem repeat, STR)和SNP(Single nucleotide polymorphism, SNP)的特点, 在本质上与STR更类似, 故属于长度多态性[18], 可使用目前法医DNA实验室普遍使用的毛细管电泳技术平台分析, 分型技术易于掌握和普及; 但其突变与SNP类似, 均源自于单突变事件, 突变率比STR低, 约为10-8, 相对较稳定; 其结构属于二等位基因多态性, 等位基因都固定且已知, 能通过很小的扩增片段进行扩增(< 100bp), 适用于高度降解DNA片段的检验[1, 2]。
本研究中, 通过筛选出互不连锁的30个InDel位点和一个性别鉴定Amelogenin基因座, 共同组成了31个遗传标记的复合多重PCR扩增体系, 并通过毛细管电泳技术, 建立了一套可用于法医DNA实验室补充鉴定的工具。本研究中调查的汉族、哈萨克族、傣族、苗族及瑶族的遗传多态性信息, 平均He分别为0.392、0.420、0.398、0.385、0.387; 平均DP分别为0.535、0.561、0.547、0.513、0.541, 而CPD分别达到0.999999999957、0.999999999990、0.999999999990、0.999999999990、0.999999999966; CPE值分别为0.985806214404、0.991703261452、0.985349899681、0.989454441374、0.981878316634; RMP分别为4.291E-11、9.829E-12、2.600E-11、1.248E-10、3.401E-11。表6为包括本研究在内的5种不同体系, 汉族人群的CDP、CPE与RMP的比较, 其中本研究与Qiagen公司的Investigator® DIPplex的成品化试剂盒的系统效能相当, 基本等同于9个STR的系统效能, 与42个IISNPs位点及18个STR基因座的系统效能差别较大。有学者认为, 像InDel这样的二等位基因遗传标记, 若要达到与目前法医鉴定中常用的商品化STR试剂盒同等的个体识别能力需要有60个这样的位点[19], 这与本体系的调查相一致。在本扩增体系中, 31个遗传标记的扩增子大小均小于220bp, 虽然限制了增加标记数的可能性, 但却增加了对降解DNA检材检验的成功率, 故可作为STR检测体系的有力补充。
表6
Table 6
表6(Table 6)
 表6 不同体系的CDP、CPE及RMP比较 Table 6 Comparison of CDP, CPE and RMP in different test systems | CDP | CPE | RMP |
---|
本体系 | 0.999 999 999 957 | 0.985 806 21 | 4.29E-11 | DIPplex[20, 21] | 0.999 999 999 985 | 0.987 710 49 | 1.42E-11 | 9个STR[22] | > 0.999 999 99 | 0.999 9 | – | 42个IISNP[23] | – | 0.999 82 | 9.5E-18 | 18个STR[24] | 0.999 999 999 999 999 999 999 973 339 | 0.999 999 973 339 | 5.74E-22 |
| 表6 不同体系的CDP、CPE及RMP比较 Table 6 Comparison of CDP, CPE and RMP in different test systems |
在群体间差异性调查中, 哈萨克族、傣族、苗族、瑶族分别与汉族进行Fisher精确概率检验, 检验水准α =0.05, 经过Bonferroni校正α =0.0125(0.05/4), 这表明, 在汉族与其它4个民族间有14个位点具统计学意义, 基因频率存在差异; AMOVA是对Wright的F统计量方差做分组分析的非参数统计方法, 估计群体间、群体内及个体间等组别的方差变异占总变异的比例[25], 结果显示, 仅有2.3 %的遗传变异来自于群体间的差异, 亦即97.7 %的遗传变异来自群体内的个体差异。
FST是表征亚群体间的遗传分化尺度, 可以对不同人群之间遗传关系的远近进行量化。FST值的大小反应了每个位点的等位基因频率在群体间变异程度, FST值越小, 说明变异程度越小。有学者认为通过群体计算得到的FST值< 0.06[13]可保证所选择的位点适用于不同的群体, 从而得到稳定的个体识别效力。在本研究中, 除33与75号位点外, 其余位点均达到此标准。33号位点中, 苗族的等位基因频率及期望杂合度与其余4个民族有显著差异, 除去苗族计算其余4个民族的FST值为0.002, 说明此位点可适用于大多数群体; 75号位点的FST值为0.078, 考虑原因为样本量过小所致, 在后续研究中增加样本量, 得到了更准确的结果。汉族、哈萨克族与傣族的样本来源分别为北京市、新疆维吾尔自治区和云南省, 苗族与瑶族则源于广西自治区, 地域相差如此之广的5个民族在群体间两两比较的FST遗传距离的最大值为0.0448, 说明30个InDel位点地域的差异并不影响群体间的变异程度。不同的统计方法均表明, 本研究筛选的位点在群体间差异性很小, 可适用于不同人群。
本系统的不足之处在于InDel位点较少, 目前不能完全替代STR这种突变率较高的遗传标记, 但是由于扩增子较小, 使其具备了检验降解DNA的可能, 为后续关于降解检材的研究奠定了基础。本文中调查的5个群体由于样本量偏少, 导致个别群体遗传数据统计结果出现偏差, 在后续研究中将进一步扩大样本量, 以期得到更为准确的结果。本系统与现有商品化或自行研发的InDel复合扩增系统相比, 在累积个体识别率相当的情况下, 所有试剂均使用国产试剂, 降低了检测成本, 为InDel标记应用于中国人群奠定了基础, 可作为STR检测体系分析DNA样本的辅助和补充工具。
The authors have declared that no competing interests exist.