微单倍型遗传标记及其法医遗传学应用
饶旼1,2, 李彩霞1, 赵钊1, 胡胜1, 赵鹏1,3, 聂胜洁2,*, 王乐1,*
1.公安部物证鉴定中心 现场物证溯源技术国家工程实验室 法医遗传学公安部重点实验室,北京100038
2.昆明医科大学法医学院,昆明 650500
3. 甘肃省临夏回族自治州公安局刑警支队,甘肃 临夏731100
* 通讯作者:王乐(1983—),男,辽宁沈阳人,博士,副主任法医师,研究方向为法医遗传学。E-mail:wangle_02@163.com;聂胜洁(1975—),女,云南昆明人,博士,教授,研究方向为法医遗传学。E-mail:nieshengjie@126.com

第一作者简介:饶旼(1992—),男,江西宜春人,硕士研究生,研究方向为法医物证学。E-mail:1731064567@qq.com

摘要

微单倍型是一种国际广泛关注的新型法医遗传学分子标记。它兼具STR和SNP遗传标记的优势,在法医混合DNA检验、种族地域推断、复杂亲缘关系分析等领域均具有重要应用前景。本文综述了微单倍型遗传标记的基本概念、命名规则,回顾了二代测序、高分辨熔解曲线、单链构象多态性分析等微单倍型检测手段,介绍了微单倍型法医遗传学应用的相关研究进展,并对微单倍型遗传标记未来发展做了展望,提出了其可能面临的挑战。

关键词: 法医遗传学; 微单倍型; 二代测序; 混合DNA; 种族推断
中图分类号:DF795.2 文献标志码:A 文章编号:1008-3650(2017)04-0324-05 doi: 10.16467/j.1008-3650.2017.04.012
Microhaplotypic Genetic Markers and Their Applications in Forensic Genetics
RAO Min1,2, LI Caixia1, ZHAO Zhao1, HU Sheng1, ZHAO Peng1,2, NIE Shengjie2,*, WANG Le1,*
1. Institute of Forensic Science, Ministry of Public Security(MPS), National Engineering Laboratory for Forensic Science, MPS’ Key Laboratory of Forensic Genetics, Beijing 100038, China;
2. School of Forensic Medicine, Kunming Medical University, Kunming 650500, China
3. The Criminal Police Detachment of Public Security Bureau of Linxia Hui Autonomous Prefecture, Linxia 731100, Gansu, China
Abstract

Although short tandem repeats (STR) and single nucleotide polymorphism (SNP) genetic markers have been being widely used in forensic individual identification, microhaplotype, defined as the combination of 2-5 SNPs within a segment of DNA up to 200 base pairs, is emerging its potential as a new type of molecular markers in forensic genetics. The microhaplotype genotyping includes single strand conformational polymorphism (SSCP), high resolution melting (HRM) analysis and next generation sequencing (NGS). SSCP is a traditional gene analysis method that can be conveniently performed at low costs. HRM has been applied to genotype SNP and DNA methylation as an alternative. However, DNA sequence information cannot be obtained directly from these two approaches. By contrast, the genotypes of microhaplotypes can be reported from NGS by direct DNA sequencing. NGS is expected to become a major method for microhaplotype detection. In addition, microhaplotype, possessing both STR and SNP markers, has important application prospects in forensic genetics, e.g., the mixed DNA genotyping, ancestry inference and complicated kinship analysis. Since microhaplotype is a multi-allelic marker without stutter peaks, it has great value for mixed DNA genotyping. The distinct pattern of microhaplotype has already been used to assist the ancestry inference from populations in Africa, Southwest Asian, East Asian, the Pacific islands and the Americans. Because of its high heterozygosity and low mutation, microhaplotype can also be applied to individual identification and lineage inference. In this paper, the basic concepts and nomenclature of microhaplotypes are introduced. Microhaplotype detection methods are presented, mainly targeting at NGS, HRM and SSCP together with the summary of their research progresses in forensic applications. Also, forensic perspectives of microhaplotypes are presented and the possible challenges discussed.

Key words: forensic genetics; microhaplotype; next generation sequencing (NGS); mixed DNA; ancestry inference

以法医学和遗传学为基础学科背景的法医DNA技术在刑事案件侦查举证、打击拐卖妇女儿童、灾害遇难者及失踪人员身份认定、民事亲权关系鉴定等领域具有广泛应用。三十年来, 法医遗传学发展进步的历史就是对新遗传标记的发现、研究与检测应用的历史。短串联重复序列(shorttandem repeat, STR)遗传标记被誉为当今人类个体识别的金标准[1], 单核苷酸多态性(singlenucleotidepolymorphism, SNP)遗传标记被应用于精准医疗、种族地域推断、表型特征刻画等领域[2], InDel、MicroRNA、DNA甲基化等遗传标记均已服务于法医遗传学应用[3, 4, 5]。微单倍型(microhaplotype)是近年来国际法医遗传学界广泛关注的一类新型遗传标记, 它兼具STR和SNP遗传标记的优势, 在混合DNA分型领域展现出巨大潜力, 且支持人类种族地域推断、复杂亲缘关系鉴定、微量降解检材检验等法医学应用。本文将系统综述微单倍型遗传标记的基本概念、检验方法、法医学应用与面临的挑战。

1 微单倍型概述
1.1 单倍型

单倍型(haplotype)是指在一条染色体或线粒体上, 紧密连锁的多个等位基因的线性组合, 每一种组合方式即为一种单倍型[6]。更进一步地讲, 单倍型是具有统计学关联性的遗传标记, 可由多个SNP位点构成, 包含丰富的遗传信息, 研究单倍型比单个SNP位点具有更好的分析效果[7]。近年来单倍型在法医学中的应用越来越广泛, 主要涉及Y染色体、X染色体及线粒体上STR和SNP多态性的研究。

1.2 微单倍型

2012年, 美国耶鲁大学Kidd教授研究团队在前期单倍型相关研究基础上, 从长度小于10KB的区域内选取位置相对靠近的SNP, 并避开易发生重组的位点, 最终筛选出8个迷你单倍型基因座(mini-haplotype)。通过对45个群体进行检测, 结果显示筛选的8个迷你单倍型基因座的高杂合度及群体分布差异性能够提供亲权鉴定及种族推断需要的相关信息[8]。为了进一步筛选更适合法医学应用的单倍型基因座, Kidd教授团队于2013年首次将微单倍型(microhaplotype)遗传标记引入法庭科学领域。相较于迷你单倍型, 微单倍型的片段长度更短, 其定义是在200 bp范围内2~5个SNP的组合[9]。由于微单倍型基因座内含有多个SNP位点, 所以微单倍型是多等位基因遗传标记, 包含更加丰富的遗传信息[10]

1.3 微单倍型的命名原则

人类基因组基因命名委员会(HUGO Gene Nomenclature Committee)已呼吁研究人员对相关领域的基因座进行命名与归类, 统一的命名将更有利于遗传数据的整理与归类。目前, 国际上对于微单倍型遗传标记尚无公认的命名规则。Kidd[9]教授在前期工作基础上, 推荐命名规则如图1。其中, 以mh16KK-049基因座为例, “ mh” 为统一字母前缀, 即微单倍型英文字母缩写; “ 16” 表示该基因座所处染色体编号; “ KK-” 代表Kidd教授实验室名称; “ 049” 为该基因座的顺序编号, 即Kidd教授研究团队筛选的第49个微单倍型基因座。此外, 共列举16个代表性微单倍型基因座(见表1)。

图1 Kidd推荐的微单倍型命名规则[11]Fig.1 The nomenclature of microhaplotype by Kidd[11]

表1 代表性微单倍型基因座列表[9, 12, 13] Table 1 List of the representative microhaplotype loci [9, 12, 13]
2 微单倍型的检测方法

微单倍型和SNP均属于序列多态性遗传标记。虽然SNP遗传标记可通过长度差异PCR引物或SNaPshot分型方法转化为长度多态性, 进而利用毛细管电泳平台检测, 但包含多个SNP的微单倍型遗传标记却很难转化为长度多态性, 所以法医DNA常用的毛细管电泳方法并不适用于微单倍型遗传标记检测。一种可行的办法是首先检测实验样本的SNP位点, 再通过Phase软件处理数据获得相应群体中微单倍型基因座的基因型以及等位基因频率等参数[9, 12, 13]
以上方法属于间接的微单倍型分型方法, 并不能直接获得微单倍型分型, 在一定程度上减缓了研究的进程。随着研究的深入, 不同的检测手段逐渐被应用, 笔者介绍目前主要的三种检测方法。

2.1 二代测序

二代测序, 也称下一代测序(next generation sequencing, NGS)或大规模并行测序(massively parallel sequencing, MPS), 在科研和临床诊断领域已得到广泛应用。相比传统的DNA测序方法, 二代测序技术具有高通量、高速度、集成化、低成本等显著优势, 在法医遗传学领域也具有重要应用前景。测序技术是序列多态性遗传标记最好的检测手段[14]。微单倍型是SNP的线性组合, 其本质仍然是SNP, 二代测序技术能够一次性获得复合体系中SNP位点的全部基因分型, 也同时获得全部微单倍型遗传标记的准确分型, 学者普遍认为二代测序将会是微单倍型检测的金标准[9, 12, 13]。四川大学张林教授研究团队[15, 16]
研发了微单倍型分型软件, 并首次选用Miseq二代测序技术平台对微单倍型进行研究, 为中国人群微单倍型遗传多态性提供了初步数据, 对微单倍型遗传标记应用于个体识别及亲权鉴定的可行性进行评估。

2.2 高分辨熔解曲线

高分辨熔解(high resolution melting, HRM)曲线是新兴的基因分析技术, 它的原理是将特定的染料嵌入DNA双链中, 通过实时监测温度变化过程中饱和染料与扩增产物的结合情况描绘出特定的熔解曲线, 从而检测出扩增片段上的序列差异[17], 具有成本低、通量高、速度快、结果准确等特点, 在SNP分型、DNA甲基化相关研究领域已发挥重要作用。Nakahara Hiroaki[18]等人对27个包含复合SNP位点的单倍域(每个单倍域长度小于100bp)在个体识别中的实用性进行了评估, 通过HRM分析筛选的7个单倍域(1q25、1q42.2、3p24、10p13、11p15.1、14q12-q13和 20q12)具有良好的多态性, 能够作为法医物证鉴定的辅助工具, 且适用于降解检材的分析。

2.3 单链构象多态性分析

Chen等[15]尝试使用单链构象多态性分析方法对337例无关个体进行微单倍型分型研究, 获得了较好的遗传多态性。单链构象多态性(single strand conformational polymorphism, SSCP)分析的原理是将PCR扩增产物变性, 变性后的单链DNA片段呈现一定的空间构象。在中性聚丙烯酰胺凝胶电泳中, 由于不同单链DNA的碱基排列顺序差异或单碱基突变, 导致空间构象存在差异, 进而改变电泳迁移率, 即构象不同的单链DNA处于不同的电泳位置。最后通过银染显影观察目的片段带型的差别。但是要确定目的片段的序列以及SNP位点的分型, 仍然需要进行测序, 并且PCR-SSCP技术不能一次检测多个基因位点, 通量小, 对电泳的条件要求较高, 在一定程度上会出现假阴性的结果, 影响结果的判读。

综上所述, PCR-SSCP技术具有成本低、操作简便等特点, HRM技术已发展成为SNP基因分型、点突变筛查的重要手段, 但上述两种方法是通过电泳图谱或熔解曲线的差异来检测特定位点基因型差异, 并不能直接获得DNA序列信息。相比之下, 二代测序技术可检测DNA序列多态性, 直接读取微单倍型分型, 随着测序技术的不断优化及测序平台的普及, 有望成为微单倍型遗传标记的主流检测技术。

3 微单倍型概述
3.1 混合DNA检验

混合生物检材是法医DNA实验室常见的疑难检材类型。多年来, 法医DNA工作者在混合生物物证检验方法方面开展了大量研究, 涌现出差异裂解法、激光显微切割、抗体磁珠、软件拆分等多种混合生物检材检验方法。以上方法虽各有优势, 却各具短
[19, 20, 21]。至今, 混合生物检材检验分型仍然是法医物证领域公认的技术难题之一。PCR扩增是STR检验的必要实验环节之一, 然而由于STR是重复序列, 在扩增过程中会由于复制滑脱伴随出现影子峰(stutter peak)。影子峰是重复序列复制的固有现象, 没有办法去除。实际工作中发现, 影子峰主要出现在比目的等位基因减少一个重复单元的位置, 峰高或峰面积占目的等位基因的比例不等, 通常在3 %~15 %, 但在比目的等位基因增加一个重复单元和减少两个重复单元的位置也可能出现。影子峰的存在, 对单一样本的正确分型不会产生严重的影响, 但对于混合样本分型的干扰非常严重。特别是在极端混合比例DNA样本中, 微量成分的目的峰与主要成分的影子峰非常相似, 严重干扰混合分型拆分。因此, 有必要考虑使用其他遗传标记辅助解决混合DNA样本检验问题。

SNP遗传标记不存在影子峰现象, 但由于其是二等位基因遗传标记, 在混合DNA分型中作用有限。微单倍型兼具STR和SNP遗传标记的优势。微单倍型为多等位基因遗传标记, 且不存在影子峰干扰, 在混合DNA检验领域具有巨大潜力, 而且, 比STR突变率更低, 扩增子更短, 适于法医遗传学应用。为了量化微单倍型基因座区分混合样本的效能, Kidd等人引入有效等位基因数目(effectivenumber of alleles, Ae)的概念[11], 并对百余个微单倍型基因座进行量化评估。有效等位基因数目是一个基因座上频率相等或相近的等位基因的数目, 其计算公式为1/∑ pi2(其中pi为等位基因i的频率)。结果表明, Ae值与微单倍型区分混合样本的能力大小呈正相关关系, 当仅检测5个平均Ae值为5的微单倍型基因座时, 其区分混合样本的累计效能已达0.99933。

3.2 种族推断

随着跨国案件的不断增加以及我国多民族混居的特征, 确定现场生物检材的种族地域特征已成为研究热点。Kidd等[9]构建了31个微单倍型的复合检测体系, 对世界人群(来自54个群体的2530名个体)微单倍型多样性进行研究, 结果表明, 等位基因频率分布的显著差异可区分非洲、西南亚、东亚、太平洋地区及美洲人群, 但是种族推断的效能低于之前报道的55个SNP位点的复合体系。Chen等[15]结合我国人群遗传特点, 采集337例无关个体样本(分别来自汉族、维吾尔族、侗族、壮族及台湾), 采用单链构型多态性分析方法对L18C1A微单倍型基因座进行检测, 结果表明该基因座98.65 %的变异来自群体内部, 1.35 %的变异发生于群体之间, 汉族与维吾尔族人群微单倍型频率分布差异显著, 且维吾尔族人群的遗传结构与其他4个群体差异较大。综上, 微单倍型遗传标记具有良好的种族推断潜力。

3.3 个体识别及亲权鉴定

2013年, 研究人员专门为亲权鉴定选取了48个微单倍型基因座, 其中28个微单倍型基因座作为遗传标记的效能等同于45个SNP检测体系[12]。如前所述, 在Kidd团队[9]构建的31个微单倍型复合体系中, 微单倍型基因座的片段长度分布于18bp至201bp之间, 杂合度中位数为0.55, 随机匹配概率低于10-15, 其法医学参数效能与CODIS系统中13个STR基因座相当, 具有良好的个体识别及亲权鉴定能力。

Wang等人[22]从UCSC和dbSNP数据库选取25个微单倍型基因座, 选用Miseq二代测序技术平台对24个样本(包含阳性对照9947, 6对父子样本, 4个汉族样本、3个维吾尔族样本和4个台湾地区样本)进行了等位基因频率和法医学参数的计算。结果表明两个位于6号及8号染色体的微单倍型基因座具有良好的多态性, 杂合度分别为0.6667/0.4444, 个体识别效能(DP)达到0.7593/0.8148, 并且6对父子样本在这两个基因座上均符合孟德尔遗传规律, 没有测序错误的发生, 有效测序深度均达到90 %以上。上述参数表明通过二代测序确证的微单倍型基因座能够运用于法医物证鉴定中的亲权鉴定与个体识别。

4 展望与挑战

微单倍型作为新型遗传标记逐渐展现出其在法医遗传学领域独特的优势, 越来越多的研究团队正在关注微单倍型遗传标记。但微单倍型的发展也存在一些困难与挑战, 主要表现在以下四个方面。首先, 现有基因座的中国人群适用性有待研究。Kidd团队通过54个群体的2531个个体筛选出百余个微单倍型基因座, 其中包含两个中国或华裔群体, 分别是旧金山华裔和台湾人群, 总共109名个体。由于我国是多民族聚集的大国, 目前筛选的基因座能否全面反映中国人群的微单倍型多态性, 仍有待研究。也有必要结合中国人群的遗传结构选取合适的位点, 提高微单倍型在我国法医工作中的实用性。第二, 缺少群体遗传数据。虽然微单倍型基因座在人群中的分布具有一定差异性, 接近STR基因座的效能, 但要运用到法医实际检案当中, 仍然需要更多的群体遗传数据做支撑; 第三, 缺少国家数据库。由于微单倍型暂时不具备STR遗传标记的大规模数据库, 在刑侦实战中发挥的作用会受到一定影响。第四, 二代测序在法医DNA实验室普及程度较低。当前, 毛细管电泳平台是法医DNA实验室的主流设备, 但不适用于微单倍型检测。相信随着二代测序平台在法医DNA实验室逐渐普及, 微单倍型检测变得更容易, 该遗传标记可以更好被法医DNA工作者接受。

The authors have declared that no competing interests exist.

作者已声明无竞争性利益关系。

参考文献
[1] BUTLER J M, COBLE MD, VALLONE PM. STRs vs. SNPs: thoughts on the future of forensic DNA testing[J]. Forensic Sci Med, 2007(3): 200-205. [本文引用:1]
[2] GETTINGS KB, LAI R, JOHNSON JL, et al. A 50-SNP assay for biogeographic ancestry and phenotype prediction in the U. S. population[J]. Forensic Sci Int, 2014(8): 101-108. [本文引用:1]
[3] PIMENTA JR, Pena SDJ. Efficient human paternity testing with a panel of 40 short insertion-deletion polymorphisms[J]. Genet Mol Res, 2010, 9(1): 601-607. [本文引用:1]
[4] ZUBAKOV D, BOERSM A W, C hoi Y , et al. Micro RNA markers for forensic body fluid identification obtained from microarray screening and quantitative RT-PCRconfirmation[J]. Int J Legal Med , 2010 , 124(3): 217-226. [本文引用:1]
[5] LEEH Y, PARK M J, CHOI A, et al. Potential forensic application of DNA methylation profiling to body fluid identification[J]. Int J Legal Med, 2012, 126(1): 55-62. [本文引用:1]
[6] GE J, BUDOWLE B, PLANZ JV, Chakraborty R: Haplotype block: a new type of forensic DNA markers. Int J Legal Med 2010, 124: 353-361. [本文引用:1]
[7] DAVIDSON S. Research suggests importance of haplotypes over SNPs[J]. Nat Biotechnol, 2000, 18(11): 1134-1135. [本文引用:1]
[8] PAKSTIS AJ, FANG R, FURTADO MR, et al. Mini-haplotypes as lineageinformative SNPs (LISNPs) and ancestry inference SNPs (AISNPs)[J]. Eur J Hum Gen, 2012(20): 1148-1154. [本文引用:1]
[9] KIDD KK, PAKSTIS AJ, SPEED WC, et al. Currentsequencing technology makes microhaplotypes a powerful new type of genetic marker for forensics[J]. Forensic SciInt, 2014(12): 215-24. [本文引用:6]
[10] KIDD KK, KIDD JR, SPEED WC, et al. Expand ing data and resources for forensic use of SNPs in individual identification[J]. Forensic Sci Int, 2012, 6(5): 646-652. [本文引用:1]
[11] KIDD KK. Proposed nomenclature for microhaplotypes[J]. Human genomics , 2016, 10(1): 1-4. [本文引用:1]
[12] KIDD KK, PAKSTIS AJ, SPEED WC, et al. Microhaplotype loci are a powerful new type of forensic marker[J]. Forensic Sci Int, supplernent Series, 2014, 4: e123-e124. [本文引用:3]
[13] KIDD KK, SPEED WC. Criteria for selecting microhaplotypes: mixture detection and deconvolution[J], Investig Genet , 2015, 6: 1. [本文引用:2]
[14] 王乐, 叶健, 白雪, . 二代测序技术及其在法医遗传学中的应用. 刑事技术, 2015, 40(5): 353-358. [本文引用:1]
[15] CHEN PENG, ZHU JING, PU YAN, et al. Microhaplotype identified and performed in genetic investigation using PCR-SSCP[J/OL]. Forensic Sci Int, 2017, 28: e1-e7. http://dx.doi.org/10.1016/j.fsigen.2017.01.008. [本文引用:3]
[16] ZHU J, ZHOU N, JIANG Y, et al. FLfinder: A novel software for the microhaplotype marker[J]. Forensic Sci Int, 2015(Supplement 5): e622-e624. [本文引用:1]
[17] LI M, ZHOU L, PALAIS R A, et al. Genotyping accuracy of high-resolution DNA melting instruments[J]. ClinChem, 2014, 60(6): 864-872. [本文引用:1]
[18] HIROAKI N, KOJI F, TETSUSHI K, et al. Approaches for identifying multiple-SNP haplotype blocks for use in human identification[J]. Legal Medicine, 2015, 17(5): 415-420. [本文引用:1]
[19] KIMYK, KWONYI. Separation and recovery of nucleic acids with improved biological activity by acid-degradable polyacrylamide gel electrophoresis[J]. Electrophoresis, 2010, 31(10): 1656-1661. [本文引用:1]
[20] AXLER-DIPERTEG, ORANSS, SINGHA, et al. Comparison and optimization of DNA recovery from sperm vs. Epithelial cells using laser capture microdissection technology and animunofluorescent staining system[J]. Forensic Sci Int , Supplement Series, 2011, 3(1): e224-e225. [本文引用:1]
[21] ANSLINGER K, BAYER B, DANILOV S M, et al. Application of sperm-specific antibodies for the separation of sperm from cell mixtures[J]. Forensic Sci Int, Supplement Series, 2008, 1(1): 394-395. [本文引用:1]
[22] WANG H, ZHU J, ZHOU N, et al. NGS technology makes microhaplotype a potential forensic marker, Forensic Sci Int , 2015(Supplement 5): e233-e234. [本文引用:1]