DNA数据库“假三联体错中”信息分析研究
赵怡1, 王平峥2, 刘莹1,*, 王旭1, 张庆霞1, 焦章平1, 刘雅诚1
1.北京市公安局刑事侦查总队,北京100010
2.承德市公安局刑事科学技术研究所,河北 承德 067000
* 通讯作者:刘莹(1976—),女,山东聊城人,硕士,副主任法医师,研究方向为DNA检验鉴定。E-mail:snow.ly@163.com

作者简介:赵怡(1987—),女,内蒙古乌兰察布人,硕士,法医师,研究方向为DNA检验鉴定。E-mail:qigemingdounanai@163.com

摘要

目的 探讨15个常染色体STR基因座用于数据库中双亲亲缘关系比中结果认定亲权的可靠性。方法 将一母体和胚胎组织的15个STR基因座输入全国DNA数据库进行三联体比对检索,并对比中结果进行亲权指数(PI)计算。采用Goldeneye 20A试剂盒对比中的各三联体样本进行复核。结果 15个STR基因座经三联体亲缘关系检索比中7名,此7例假三联体累计亲权指数为1.33×106到2.77×107,加做到19个基因座后,比中个体均出现至少3个基因座不符合遗传规律。结论 Identifiler plus试剂盒15个STR基因座用于在数据库比中的亲缘关系鉴定可能出现错误结论;单纯利用PI值来认定亲缘关系是不合理的;建议应用19个或更多的基因座建设DNA数据库和进行亲缘关系判定。

关键词: DNA数据库; STR; 亲权指数
中图分类号:DF795.2 文献标志码:B 文章编号:1008-3650(2016)06-0497-03 doi: 10.16467/j.1008-3650.2016.06.016
Analysis of False Match of Paternity Resulted from the Pseudo-triad in DNA Database
ZHAO Yi1, WANG Pingzheng2, LIU Ying1,*, WANG Xu1, ZHANG Qingxia1, JIAO Zhangping1, LIU Yacheng1
1. Beijing Criminal Investigation Department, Beijing 100010, China
2. Chengde Criminal Investigation Department, Hebei, Chengde 067000, China
Abstract

Objective To evaluate the reliability of paternity identification through matching the 15 STR loci in DNA database.Methods The data of 15 STR loci obtained by Identifiler plus kit from the tissues of a woman and her pregnant fetus, were undergone triplet matching by the national DNA database to be searched into, and the results were compared and the PI (paternity index) value calculated. Goldeneye 20A kit, containing 19 STR loci, was used to re-examine the 7 individuals who matched the known mother-child duos through DNA database searching, and the related exclusion was also observed with the kit.Results Among the 7 fictitious trios, the PI values were from 1.33×106 to 2.77×107. However, the number of excluded loci was increased to at least 3 when the tested loci were added to 19.Conclusion The results shown here demonstrated that it is not reliable to determine the paternity by the 15 STR loci of Identifiler plus kit, and neither that only by PI value. Hence, it is suggested that the DNA database should be constructed with 19 or more STR loci under which the paternity determination could be better secured.

Key words: DNA database; STR; paternity index

随着各地公安机关对DNA数据库建设的重视, 我国DNA数据库库容已突破3000万。由于入库STR基因座数量的局限性, 不断递增的DNA数据库库容增加了随机亲缘匹配的风险, 出现“ 错中” 的假三联体概率也随之增加[1]

本文以实际工作中遇到的一起强奸致孕案为例, 来说明增加STR基因座数量的必要性。

1 案件简介

某年9月, 在北京市某区发生一起强奸致孕案, 提取受害者谈某和胚胎组织的DNA用Identifiler plus试剂盒检验后录入全国DNA数据库, 经三联体亲缘关系比对, 该试剂盒的15个基因座无容差比中数据库中7名人员, 后经案情信息比对, 发现上述比中人员与受害者均无关联, 不具备发生性关系的可能性, 故排除此7名人员的作案嫌疑。

2 材料与方法

样本为该案受害人血样、胚胎组织以及数据库中比中的15个基因座DNA分型均符合遗传规律的7名人员的血样。

DNA IQ™ system(Promega公司)提取DNA, Identifiler plus试剂盒(以下简称ID试剂盒)(Thermo Fisher公司)扩增, Goldeneye 20A试剂盒(以下简称20A试剂盒)再次扩增进行复核, 扩增均按照试剂盒说明操作。

ABI 3130型遗传分析仪电泳分离并检测PCR产物, GeneMapper V3.2.1软件进行分型分析。

3 结果与讨论

各样本的STR分型结果及计算所得各基因座PI值见表1

表1 ID试剂盒检测符合遗传规律的各位点的PI值及新增系统STR分型 Table 1 The PI values of STR loci from Identifiler plus kit and the added STR loci

当前, 我国DNA数据库的库容已突破3000万, DNA数据库的作用与日俱增。庞大容量的DNA数据库提高了案件入库比对成功率[1], 但由于入库STR基因座数量有限, 不断增加的库容也增加了随机亲缘匹配的概率, 导致出现错误比中的假三联体[2]。类似案例其他学者也有报道[3]

本文案例来自于日常检案, 经数据库比对发现“ 假三联体错中” , 比中的7名人员在ID试剂盒的15个基因座全部符合亲子鉴定的遗传规律, 经核实案情信息后发现均可予以排除。

数据库比对中出现“ 假三联体错中” , 主要由于数据库中的数据频率分布并不符合Hardy-Weinberg定律, 所以无法计算非父排除率等遗传分析系统效能的评估指标。当进行亲权鉴定时, STR基因座只有服从孟德尔遗传规律才具备计算亲权指数及非父排除率的前提条件[4], 根据《法庭科学DNA亲子鉴定规范》中有关亲权鉴定的规则, 经过累计非父排除率大于99.99 %的多个基因座的检测, 发现基因座均符合遗传规律, 此时计算亲权指数PI, 若累计亲权指数(CPI)大于10 000, 则支持亲权关系的存在。亲权鉴定实际上是一种统计学上的推断过程, 必然存在相应的风险, 故鉴定人在得到数据库比对的信息后要进行相应的风险评估。

文中案例使用目前国内在案件检验中常用的ID试剂盒, 计算所依赖的STR基因座频率来源于北京地区汉族人群数据[5], 15个基因座CPI从1.33× 106到2.77× 107, 均远大于10 000, 若直接依据PI值, 貌似符合亲缘关系认定标准, 但数据库中的个体并非随机个体, 因此数据库中群体遗传学数据与来源于随机个体的群体遗传学数据有所不同, 使用随机个体的群体遗传学数据衡量数据库搜索结果的证据强度显然是不合适的。

另外, 案情描述也可起到甄别作用。使用20A试剂盒进行复核, 即增加了4个常染色体STR基因座(Penta D、Penta E、D6S1043、D12S391)后, 上述比中个体均出现至少3个基因座不符合遗传规律, 否定了上述认定亲缘关系的结论。由此可见, 对于数据库中比中的三联体的认定并不能仅仅依靠PI值的计算, 只有认定“ 被控父” 的唯一性, 即已知父权前概率的基础上, 了解不同个体间不符合孟德尔遗传规律的基因座个数的分布规律, 当累计非父排除率大于99.99 %, 才具备计算PI值的前提条件[4]

由此可见, 15个STR基因座对于亲缘鉴定来说识别能力不足, 随着数据库信息量的不断增加, 15个基因座认定的错配数量还会增加, 可能发生误判的几率也会增加。基因座Penta D、D6S1043在上述7个个体中均不符合遗传规律, Penta D、D6S1043的非父排除率分别为0.6183、0.7190[5]。所以, 增加效能强的遗传标记对数据库中匹配的亲缘关系或失踪人员的身份认定有显著效果[4]

因此, 建议对数据库中需要确定身份的个体, 入库应不少于19个基因座, 并且在基因座的选择时, 建议尽量选择非父排除率高的基因座(如Penta D、Penta E等)提高系统效能[6]。此外, X-STR、Y-STR作为常染色体的补充, 在复杂亲缘鉴定中也可以起到印证作用。综上所述, 建议对数据库入库人员样本应检验不少于19个具有较高鉴定效能的常染色体STR基因座, 必要时增加性染色体STR, 以保证结论的可靠性和准确性。

The authors have declared that no competing interests exist.

作者已声明无竞争性利益关系。The authors have declared that no competing interests exist.

参考文献
[1] 姜先华. 中国DNA数据库建设应用技术现状及发展趋势[J]. 中国法医学杂志, 2011, 26(5): 383-386. [本文引用:2]
[2] 张庆霞, 刘雅诚. DNA数据库中失踪人员亲属“错中”信息的分析研究数字实验室[C]. 中国人民公安大学出版社, DNA数据库建设应用成果与展望Ⅱ, 2011: 169-171. [本文引用:1]
[3] 高林林, 常莹, 张明亚, . DNA数据库中未知名尸与失踪人员亲属“错中”1例[J]. 刑事技术, 2014(3): 60-61. [本文引用:1]
[4] 李成涛, 赵书民, 柳燕. DNA鉴定前沿[M]. 北京: 科学出版社, 2011. [本文引用:3]
[5] Liu YC, Huo ZY, Tang H, et al. Frequency data for 15 STR Loci and forensic use in a Beijing-Han population[J]. International Congress Series, 2003(1239): 267-270. [本文引用:2]
[6] 伍新尧, 杨庆恩, 刘雅诚, . 亲权鉴定判断标准和结论表述的建立[J]. 中山大学学报(医学科学版), 2010, 31(1): 20-22. [本文引用:1]