第一作者简介:尚蕾(1989—),女,山东临沂人,博士,主检法医师,研究方向为法医遗传学。E-mail:bluesnoopy9@126.com
Y-STR技术现已成为法庭科学领域重要的检验鉴定方法。目前单拷贝Y-STR基因座广受瞩目,然而,多拷贝Y-STR基因座在Y染色体上有2~4个拷贝,多态性更高,可望作为Y-STR鉴定的重要补充。迄今为止,已报道的多拷贝基因座达几十种,其中包含多个快速突变的基因座。利用各地的人群样本,国内外陆续开展了针对少数多拷贝基因座的遗传多态性研究,其中,国内的此类研究多集中于河南汉族人群,全面的研究工作仍待推进。现有的Y-STR复合扩增体系多数只包含2~3个多拷贝基因座,将大量多拷贝Y-STR基因座纳入复合扩增体系将可能提升系统的检验效能。本文从多拷贝Y-STR基因座的结构特点、突变特点、遗传多态性及复合扩增研究等多方面进行了综合评述,并提出了未来多拷贝Y-STR基因座的研究方向,为Y-STR技术更好地应用于法庭科学领域进行了初步探索。
As one of the most important genetic markers used in forensic science, Y-STR has been widely applied, with its single-copied loci being paid extraordinary attention. However, multi-copied Y-STR loci generally contain 2-4 copies and display high genetic polymorphism, therefore allowing them to be an important replenishment to the current technique. Although there are reports on dozens of multi-copied Y-STR loci, including multiple rapidly-mutating loci, yet these researches only focus a few of them on the genetic diversity. The related studies in China have been mostly carried out on Han population, mainly from Henan province, therefore expecting them to be extended to a wider scope. The present-used multiplexes usually include only 2-3 multi-copied loci. Thus, the inclusion of more multi-copied loci might improve their discrimination power. In this paper, a comprehensive review was made on the studies about the multi-copied Y-STR locus’ structure, mutation, allelic frequency and the involved multiplex construction, finally pointing out the directions for future research.
多拷贝Y-STR是指在Y染色体中广泛存在的拥有多个拷贝的STR基因座, 遵循父系遗传规律。这类基因座的核心重复单元通常为2~5个碱基, 拥有2~4个拷贝。由于序列重复次数及核心重复单元碱基数不同, 各多拷贝Y-STR基因座的核心序列大小存在较大差异, 少则二十几个碱基对, 多则上百个碱基对。
Y染色体95 %的区域为非重组区。即便大量的回文结构能起到一定的基因修复作用, 遗传重组的缺失仍使染色体中重复、缺失、倒位等突变事件大量出现, 并得以不断累积。Y染色体上STR基因座存在多个拷贝, 可能与该染色体的特殊结构有关。当前, Y-STR技术的广泛应用为大量案件的侦破提供了重要线索。然而, 目前使用的Y-STR检验试剂中包含较多的是单拷贝基因座, 如DYS19、DYS391、DYS438等, 多拷贝基因座却相对较少。而实际上, 多拷贝Y-STR基因座在多态性等方面更具独特优势, 法医学应用价值也更大。
关于多拷贝Y-STR基因座的报道初见于20世纪90年代[1, 2, 3]。21世纪初, 多拷贝Y-STR基因座被进一步发现和研究[4, 5]。近二十多年来, 已报道的多拷贝Y-STR基因座约有40个, 研究较多的多拷贝Y-STR基因座见表1。其中, 常用的多拷贝Y-STR基因座核心重复序列多为四碱基, 常位于Y染色体的q区。不同的多拷贝Y-STR基因座, 其各拷贝的相对位置存在较大差异。多拷贝Y-STR基因座的各拷贝可能分散于染色体上相对较远的位置, 也会呈现相反的序列, 如DYS385(图1a), 或者其中两个拷贝位置较近, 而与另一个或者另一组拷贝相距较远, 如DYF399S1、DYS464、DYF371等(图1a)。目前发现的多拷贝Y-STR基因座大多属于这一类。另外, 基因座的两个拷贝也可能呈现“ 包含关系” , 如DYS389I/II、DYS526(图1b)。此类基因座中, 两个拷贝在一端共享一段固定的序列, 另一端有一段序列完全相同。扩增时, 一条引物结合在共享端, 另一条引物则有两个退火结合部位, 从而能扩增产生出两个大小不同的片段(图1b)。
![]() | 表1 常见的多拷贝Y-STR基因座信息 Table 1 Information of the multi-copied Y-STR loci that are commonly used |
与常染色体STR和其他Y染色体STR类似, 不同多拷贝Y-STR基因座也存在突变率的高低, 并可能出现异常分型。近些年研究发现[11], 有5个多拷贝基因座(DYF387S1、DYF399S1、DYF403S1、DYF404S1、DYS526)其突变率均高于1× 10-2, 为快速突变基因座, 对法医个体识别有帮助作用。相比之下, 其他一些多拷贝基因座的突变率略低, 但仍高于1× 10-3(1.51× 10-3~7.27× 10-3不等)[9]。相对高的突变率将更易引起异常等位基因的出现。张文琼等[23]研究了湖北汉族人群4个多拷贝快速突变基因座(DYF387S1、DYF399S1、DYF403S1、DYF404S1)的遗传多态性, 发现样本的异常分型发生率高达7.94%, 且个别样本在其中3个基因座的分型也呈异常。这提示多拷贝基因座的判读需要更加谨慎, 同时, 对混合样本中嫌疑人的判定也应结合其他方面加以综合考虑。
STR基因座能否在法庭科学领域广泛应用, 很大程度上取决于该基因座在人群中的等位基因频率分布。通常, 在人群中多态性较高的基因座会得到更多的关注。国际上, 自多拷贝基因座发现以来, 遗传多态性即得到了广泛的研究[1, 3, 12, 17, 24]。至今已有的多拷贝Y-STR研究中, 针对DYS385、DYS389I/II两个基因座开展的人群研究数量最多。Redd等[4]利用YCC(Y染色体联合会)样本和欧裔美国人群样本, 针对14个新发现的Y-STR基因座进行了遗传分析, 发现6个多拷贝基因座中有4个(DYS464、DYS385、YCAII和DYF371)在两类样本中表现出极高的基因多样性(GD值为0.823~0.973), 而DYS459多态性稍低(GD值为0.667~0.730)。相比之下, 单拷贝Y-STR基因座总体多态性较低, GD值为0.027~0.874。另有研究涉及单一地区人群(如德国[25]、奥地利[26, 27]、美国[10, 14, 15, 28]、中国[29]等)中DYS385、DYS389I/II、DYS459、DYS464、DYS527等基因座的遗传分析, 同样发现, 多拷贝Y-STR基因座的遗传多态性普遍高于单拷贝基因座。这些研究为后期基因座的选择、应用提供了重要的基础数据。
自21世纪初, 国内也陆续开展了Y-STR基因座的等位基因频率调查工作。研究主要利用自主研发的复合扩增体系、进口试剂盒(如PowerPlex® Y, AmpFlSTR® Yfiler)或者国产试剂盒(如DNATyperY21)对特定人群样本进行遗传多态性分析[30, 31, 32, 33, 34, 35]。研究发现DYS385、DYS389I/II在中国人群的基因多样性分别为0.841~0.975, 0.872~0.907[31, 33, 34, 36, 37, 38, 39, 40, 41], 均高于其他单拷贝基因座的遗传多态性水平。2006年起, 其他多拷贝基因座的等位基因频率调查研究逐步展开[42, 43, 44], 但研究人群以河南汉族居多[45, 46, 47, 48]。此类研究也显示, 多拷贝基因座具有较高的遗传多态性。
针对快速突变的多拷贝Y-STR基因座, 国内外也开展了大量的研究工作[11, 49]。各国的研究人员利用人群样本, 探讨了快速突变Y-STR基因座在欧亚[50]、荷兰[51]、意大利[52]、阿联酋[53, 54, 55, 56]以及中国[57, 58]、韩国[59]等地区人群中的多态性。在快速突变的Y-STR基因座中, 多拷贝基因座和单拷贝基因座具有相似的遗传多态性水平。
常见多拷贝Y-STR基因座在中国人群中的等位基因频率调查结果见表2(DYS385、DYS389I/II由于相关研究数量众多, 在此并未一一列出)。此类研究可为后期多拷贝Y-STR基因座的选择提供基础数据参考。但由表可见, 目前国内关于多拷贝Y-STR基因座的研究还较有限, 有待于进一步开展。
![]() | 表2 常见多拷贝Y-STR基因座在中国人群中的遗传多态性 Table 2 Genetic or haplotype diversity of commonly-used multi-copied Y-STR loci in Chinese population |
值得注意的是, 多拷贝Y-STR基因座的各等位基因, 现有两种广为接受的命名方法。一种为C型命名法(Conservative approach; C-type), 即根据观察到的等位基因片段大小直接命名, 不考虑各片段的峰高[60, 61, 62]。另一种是E型命名法(Expanded typing method; E-type), 即结合观察到的等位基因片段大小及其峰高比例进行命名[4, 10, 62]。以DYF399S1基因座为例, 如扩增后检测发现两个峰形, 且二者高低不同, 则该基因座的C型单倍型将读为“ 低-高” , 而其E型单倍型则读为“ 低-高-高” 。对于两拷贝的基因座而言, 这两类命名方法的结果很容易进行转换, 并无本质区别。但对于三拷贝及以上的基因座而言, C型和E型命名方法的结果存在较大差异, E型命名法获得的单倍型数目往往更多。
多拷贝Y-STR基因座的扩增与单拷贝基因座略有不同。每次扩增时, 基因座的引物将结合在染色体的多个位置, 从而在一次扩增后的电泳图中, 往往可见1~n(n为该基因座的拷贝数)个峰出现。正因如此, 多拷贝Y-STR基因座的复合扩增难度也相对更大。
目前, 包含大量多拷贝Y-STR基因座的复合扩增体系尚未出现, 但在已有的Y-STR基因座复合扩增体系中, 不乏多拷贝Y-STR基因座。例如, 体系中常见DYS385、DYF387S1、DYS389I/II等3个多拷贝Y-STR基因座, 偶见DYS459、DYS527a/b、DYS464等3个多拷贝Y-STR基因座, 但每个体系中含有的多拷贝基因座数量不一, 多数为2~3个不等(表3)。
![]() | 表3 常见Y-STR复合扩增体系中多拷贝Y-STR基因座的分布 Table 3 Distribution of multi-copied Y-STR loci in different Y-STR multiplexes |
在Ballantyne等[11]筛选出快速突变的Y-STR基因座后, Alghafri等[56]建成了一个包含13个快速突变Y-STR的扩增体系, 其中5个为多拷贝基因座, 这是目前含有多拷贝Y-STR基因座数量最多的复合扩增体系。国内, 黄艳梅等[64]建立了一个四色荧光复合扩增体系, 其中包括3个多拷贝和7个单拷贝Y-STR基因座。该体系率先将DYF399S1、DYF403S1、DYF404S1等3个快速突变的多拷贝基因座进行复合, 并将其他4个快速突变的单拷贝基因座也加入其中, 虽然在总基因座数目上仍显不足, 却不失为一次有益的尝试。这也提示, 今后Y-STR复合扩增体系可考虑纳入更多的多拷贝基因座, 以增强扩增体系整体的检验效能。
如前所述, 与单拷贝基因座相比, 多拷贝Y-STR基因座在染色体上存在多个拷贝, 总体遗传多态性高, 拥有其独特的优势, 可大大提升Y-STR的系统检验效能。因此, 它不仅可用于日常检案的个体识别、父系亲权关系鉴定等, 在混合斑男性个体成分的检验中也可发挥重要作用。同时, 不少多拷贝基因座的突变率较高, 使此类基因座有望应用于近缘男性个体的识别, 而在法庭科学领域发挥其潜在价值。
当然, 多拷贝基因座也存在一定的局限性。单基因座扩增后可形成2~4个相同或不同的产物片段, 根据C型统计法, 可直接获得单倍型数目, 而如果根据E型方法进行统计, 需要考虑峰形高低, 则容易产生分型误差。此外, 混合样本中男性个体的数量, 仅可通过多拷贝基因座粗略估计, 难以准确获知。
尽管如此, 多拷贝Y-STR基因座在法庭科学领域仍具有重要的应用价值。针对目前在频率调查、复合扩增等方面的研究空白, 未来可以针对多拷贝Y-STR基因座开展以下工作:
1)中国人群多拷贝Y-STR基因座的频率调查研究。已有的研究多集中于河南汉族人群, 要获得对中国人群多拷贝Y-STR基因座等位基因频率分布的全面掌握, 应针对中国境内不同地区、多个民族的人群开展频率调查, 为后期多拷贝Y-STR基因座的选择提供重要的数据支撑。
2)多拷贝Y-STR基因座对近缘男性个体的分辨力研究。日常检案中, 有时混合斑中男性个体Y-STR的分型可以确定, 但在家族内进行嫌疑人排查时由于缺少常染色体分型, 会导致排查困难。高分辨力的Y-STR基因座将有助于解决此类问题。
3)多拷贝Y-STR基因座复合扩增体系研究。包含大量多拷贝Y-STR基因座的复合扩增体系, 将拥有更高的扩增效率和系统检验效能, 并可成为现有Y-STR体系的重要补充。
4)多拷贝Y-STR基因座的人群推断研究。在对中国人群进行基因座等位基因频率调查的基础上, 统计不同地区或民族人群中多拷贝Y-STR基因座的特有单倍型, 将可能为不同地区或民族人群的推断提供一条新途径。
The authors have declared that no competing interests exist.
作者已声明无竞争性利益关系。The authors have declared that no competing interests exist.
[1] |
|
[2] |
|
[3] |
|
[4] |
|
[5] |
|
[6] |
|
[7] |
|
[8] |
|
[9] |
|
[10] |
|
[11] |
|
[12] |
|
[13] |
|
[14] |
|
[15] |
|
[16] |
|
[17] |
|
[18] |
|
[19] |
|
[20] |
|
[21] |
|
[22] |
|
[23] |
|
[24] |
|
[25] |
|
[26] |
|
[27] |
|
[28] |
|
[29] |
|
[30] |
|
[31] |
|
[32] |
|
[33] |
|
[34] |
|
[35] |
|
[36] |
|
[37] |
|
[38] |
|
[39] |
|
[40] |
|
[41] |
|
[42] |
|
[43] |
|
[44] |
|
[45] |
|
[46] |
|
[47] |
|
[48] |
|
[49] |
|
[50] |
|
[51] |
|
[52] |
|
[53] |
|
[54] |
|
[55] |
|
[56] |
|
[57] |
|
[58] |
|
[59] |
|
[60] |
|
[61] |
|
[62] |
|
[63] |
|
[64] |
|