基于数据库数据分析的DNA证据作用评价
刘冰
公安部物证鉴定中心, 北京 100038

作者简介:刘 冰(1974—),男,黑龙江齐齐哈尔人,副主任法医师,研究方向为法医遗传学。 E-mail: liubing@cifs.gov.cn

摘要

始建于2003年的全国公安机关DNA数据库10余年来累积了千万级的数据信息,其中除DNA分型等技术数据外,还包括大量的案件、物证、人员的相关信息。本文尝试以DNA数据库的相关数据为基础,选取2011~2014年的部分数据,从时间、物证类型、案件类型、比中率等多个维度进行综合比较,对DNA证据在刑事案件中的价值和应用进行较为系统的分析。结果显示:目前DNA证据在破案和串并案件中的有效利用率接近50%,在刑事案件,特别是强奸、杀人案件中的比中率(MRe)平均高达71.1%和62.1%,具有不可替代的作用;DNA证据在打击职业性犯罪中的作用越来越显著,2011~2014年,盗窃案件中的物证增长了124.0%,比中数量提升了55.3%;非刑事案件对DNA证据的需求显著增长,2011~2014年,毒品类犯罪物证增长了477.3%,比中数量提升了378.6%。通过对常见生物物证的实用价值分析,发现传统的生物物证仍是DNA实验室的主要检测对象,血液(斑)、精斑、唾液斑(包括烟蒂)占到了总量的82.8%,同时检测对象的种类也在不断的拓展之中,2011~2014年,脱落细胞类数量增长了241.7%,比中数量提升了158.5%。最后提出了不同类型案件现场勘查中应关注的典型物证的建议。

关键词: 法医遗传学; DNA数据库; DNA分析; 数据分析; 生物物证; 刑事侦查
中图分类号:DF795.2 文献标志码:中图分类号: DF795.2 文献标识号:A 文章编号:1008-3650(2015)03-0199-05 文章编号:1008-3650(2015)03-0199-05 doi: 10.16467/j.1008-3650.2015.03.007
A Preliminary Evaluation of DNA Evidence in Criminal Investigations Based on National DNA Database
LIU Bing
Institute of Forensic Science, Ministry of Public Security, Beijing 100038,China
Abstract

For the last decade, China national DNA database has expanded exponentially, and held tens of millions of data, including not only the DNA profiles, but also a large amount of relevant information, related to crime scenes, evidence, individuals, etc. This paper attempts to evaluate the function of DNA evidence and DNA analysis in criminal investigations. Data in the national DNA database uploaded from 2011 to 2014 was selected, and a systematic analysis is carried out on multiple dimensions, such as time, evidence type, crime type, match rate, etc. As expected, DNA analysis has an outstanding performance in criminal investigations either in case solving or crime linking with the effective utilization rate close to 50%. It emerges as a powerful tool in criminal investigations, especially in rape cases with matching rate of evidence (MRe) of 71.1%, and murder case at 62.1% of matching rate. The DNA evidence also plays significant role in fighting against professional crimes from 2011 to 2014, in which the evidence for theft and drug cases rises to 124%, 477.3%, and the match number up to 55.3%, 378.6%, respectively. By the systematic analysis of the practical value of common biological evidence, it reveals that traditional biological sample, like blood, semen and saliva (including cigarette butt), covers 82.8% of all the samples detected in DNA laboratories, while new types of samples are becoming more popular. During the same period of time, the number of touch DNA evidence has a growth of 241.7% in total and the match number rises to 158.5%. This paper also proposes that the key evidence should be carefully collected according to the specific type of crime scene to make sure that the evidence won’t be compromised in the following investigation and litigation.

Keyword: forensic genetics; DNA database; DNA analysis; data analysis; biological evidence; criminal investigation

DNA检测技术已广泛应用于刑事侦查、民事诉讼和社会重大事件的处理。在国外, DNA检测技术被奉为“ 黄金标准” , 美国科学院国家研究顾问委员会认为到目前为止, 只有DNA检验技术能够满足科学的基本要求[1]。30年来, DNA检测技术经历了长足的发展, 国内外大量的文章从不同角度阐述了DNA证据在刑事案件侦查、诉讼中的重要价值和不可替代的作用。受基础信息汇聚、整合等客观条件的限制, 虽然也有基于数据库中批量数据的分析[2], 但由于案例数量不足、结论的系统性、代表性和全面性具有一定局限性。2009年Google在Nature上刊登了一篇关于流感趋势预测的文章[3], 引发了一场新的数据分析和处理方式的变革。全国公安机关DNA数据库(以下简称“ DNA数据库” )始建于2003年, 10余年来各类数据信息增长迅速, 累积了千万级的数据信息, 其中除DNA分型等技术数据外, 还包括大量的案件、物证、人员的相关信息。本文尝试以DNA数据库相关数据为基础, 选取2011~2014年间的部分数据, 从时间、物证类型、案件类型、比中率等多个维度进行综合比较, 对DNA证据在刑事案件中的价值和应用进行较为系统的分析, 基于此为DNA检测技术在刑事侦查以及法庭科学领域的应用提供参考意见。

1 DNA数据库的比中率

本文使用了比中率(match rate, MR)作为数据分析的一个重要维度。比中(match), 指DNA数据库中DNA分型结果的匹配, 这种匹配存在物证、人员间交叉存在。物证的比中率是衡量DNA数据库中生物物证作用的一个重要参数。比中率(MR)的计算公式如下:

MR=NmN

式中:Nm指DNA数据库中有匹配关系的样本数量, 包括物证和人员样本; N指DNA数据库中的样本总数。

物证的比中率(match rate of evidence, MRe)计算公式如下:

MRe=NemNE

式中:Nem指DNA数据库中有匹配关系的物证样本数量; Ne指DNA数据库中的物证样本总数。

物证比中率(MRe)分为“ 物证-人员” 比中率(match rate of evidence-individual, MRei)和“ 物证-物证” 比中率(match rate of evidence-evidence, MRee), 前者的匹配关系发生在物证样本和人员样本之间, 后者的匹配关系发生在物证样本和物证样本之间。在一个数据相对健康的DNA数据库中(指不存在大量无意义录入的重复样本), 因此, MRei用于衡量物证在破案中的作用, MRee用于衡量物证在案件串并中的作用。因此MRe又可以称为物证的综合比中率, 下文中如无特殊说明, 统一简称为比中率。

2 DNA证据在刑事案件中的整体价值

2011~2014年, DNA数据库中累计新增物证DNA信息78.2万, “ 物证-人员” 比中率(MRei)分别为52.8%、44.1%、40.2%和39.0%, 平均达到43.2%; “ 物证-物证” 比中率(MRee)分别为6.7%、5.6%、4.9%和5.5%, 平均为5.6%(见图1)。抽样统计杀人、强奸、盗窃、抢劫、伤害以及交通、毒品等6类案件的物证DNA(见图2), 其总体数量在增长了60.9%, 占全部入库物证DNA的70.0%, 比中数量占全部比中的70.2%。综合分析抽样数据显示:(1)DNA证据的综合应用效能高, 在破案和串并案件中的有效利用率接近50%(2011~2014年, 比中率分别为59.5%、49.8%、45.1%和44.5%, 平均为49.7%); (2)在刑事案件中, 特别是在强奸、杀人案件中DNA证据具有不可替代的作用, 两类案件中比中率平均为71.1%和62.1%, 远高于平均水平; (3)DNA证据在打击职业性犯罪中的作用越来越显著, 2011~2014年的盗窃案件物证DNA数量增长了124.0%, 比中数量提升了55.3%; (4)非刑事案件对DNA证据的需求逐年显著增长, 毒品类犯罪物证数量增长了477.3%, 所占比例从2011年的0.4%提高到2014年的1.7%, 比中数量提升了378.6%。

图 1 DNA数据库物证DNA比中情况(2011~2014年)Fig.1 Match rate of evidence in China national DNA database (2011~2014)

图 2 数据库中的6类案件物证DNA(2011~2014年)。A:入库情况, B:比中情况Fig.2 Crime scene (theft, murder, rape, robbery, traffic and drugs) profiles in China national DNA database (2011~2014). A: loaded data; B: matches

但与英国国家DNA数据库(NDNAD)相比, 作为衡量DNA数据库主要指标之一的MRei尚存在差距(见表1)。造成这一差异的原因较为复杂, 主要来自于两个方面:一是与英国相比, 我国DNA数据库人口覆盖率较低不足全部人口的2%, 而英国则接近10%; 二是现场提取的生物物证质量不高, 特别是物证与案件的相关性还不够好。

表 1 我国与英国国家DNA数据库的物证DNA比中情况对比 Table 1 Comparison of evidence-individual match rates between China national DNA database and NDNAD
3 常见生物物证的实用价值分析
3.1 传统生物物证

数据分析显示(见图3, 表2), 血液(斑)、精斑、唾液斑(包括烟蒂)三类物证占了总量的82.8%, 物证实用价值也保持在较高的水平上, MRe分别为64.3%、44.5%和65.9%。其中, 血液(斑)和精斑仍是目前案件DNA检测中实用价值较高的物证。血液(斑)在物证中所占比率较高, 达到40.5%, 反映其适用案件类型广泛, 现场易于获得。精斑则是强奸案件中较为传统的一类检材, 统计结果显示, 精斑在强奸(含强奸杀人)案的MRe为83.6%, 说明其在涉性犯罪中具有不可替代的实用价值。

图 3 DNA数据库中DNA物证分类(2011~2014年)Fig.3 Classification of DNA profile in China national DNA database (2011~2014)

表 2 DNA数据库常见生物物证DNA的比中率 Table 2 Match rates of DNA profile in China national DNA database
3.2 其他种类的生物物证

图3中, 无法用传统分类方法归类的生物物证已占到总量的4.36%, 且MRe和MRei高达95.5%和88.5%(见表2), 远远高于其他物证和平均水平, 可以推测此类物证与案件的相关性如此之高, 与现场勘查中技术人员对物证的有效甄别和有效采集密不可分。以脱落细胞为代表的生物物证成为近年DNA检测技术的新热点(见表3), 2011~2014年, 脱落细胞类DNA数量增长了241.7%, 比中数量提升158.5%。这也客观反映了DNA检测技术的不断发展和技术人员总体水平的逐步提高。

表 3 DNA数据库中的脱落细胞DNA比中统计(2011~2014) Table 3 Matches of touch DNA profile in China national DNA database (2011~2014)
3.3 不同类型案件的典型物证

统计的结果(见表2, 表4)显示案件类型与物证类型间、案件类型与比中率之间存在一定的相关性:某一类的物证在特定类型案件中的特定指标, 如提取比例、比中率往往高于其他类型的案件。如指甲的综合比中率为70.1%, 但根据案件类型和比中率的分布来看, 指甲类物证在杀人、伤害、抢劫、强奸等4类案件中发挥了更为重要的作用, 63.8%的物证和71.1%的比中都来源于这4类案件。再如毛发, 根据其分布来看, 毛发类物证在杀人、强奸、伤害、盗窃类案件中较为常见, 但是其在强奸、杀人案件中发挥的作用(MRe)为52.2%和47.0%)远远高于其他两类案件。基于上述分析, 本文尝试给出不同类型案件中建议关注的典型物证(见表5), 供现场勘查中结合案情参考使用。

表 4 DNA数据库中的常见生物物证在不同案件中的综合比中率统计 Table 4 Match rate of evidence (MRe) in China different types of criminal cases in China national DNA database
表 5 不同类型案件中建议关注的典型物证 Table 5 Key evidence suggested to collect from specific crime scenes

此外, 也要注意到现场勘查中生物物证的有效提取是发挥生物物证作用的关键, 如烟蒂类物证占到物证总数的18.88%, 但是比中率仅为52.6%, MRei仅为43.8%, 价值水平低于平均值。这可能与此类物证在现场中比较容易获取, 现场勘查中甄别的不细致导致所提取物证与案件关联性低有直接关系。

DNA证据在刑事侦查以及法庭科学中的价值涉及到多个方面的因素。使用数据分析是一个新的尝试, 不排除存在背离事实的风险。即使对于曾被视为大数据分析经典的Google的流感预测来说, 2014年《科学》杂志也发文指出, 其近年来的预测结果超过了美国CDC根据全美各实验室监测报告得出预测结果的两倍[8]。本文中的分析结果也可能受到基础数据条件的限制, 存在不足, 如:DNA数据库中的案件分类不能够全面、具体的反映出案件的更多特征; 基础数据无法反映出生物物证的检出率; 数据库中各类数据的重复录入对分析的结果存在影响; “ 物证-人员” 比中率没有把涉案人员单独考虑, 可能造成物证实用价值的高估; DNA数据库中物证的分类边界还不清楚, 不能准确反映物证的属性等。

客观地讲, 基于大量数据的分析还不能完全取代传统的数据收集方法, 但是已经可以作为后者的有益补充。本文基于DNA数据分析的方法, 初步给出了DNA检测技术近年来在刑事侦查以及法庭科学领域的应用的部分特点和趋势, 希望能对DNA技术今后的实际应用给予有益的参考。

The authors have declared that no competing interests exist.

参考文献
[1] Committee on Identifying the Needs of the Forensic Sciences Community, Committee on Science, Technology, Law, Committee on Applied and Theoretical Statistics, et al. Strengthening forensic science in the United States: a path forward [M]. Washington DC: The National Academies Press, 2009: 38-39. [本文引用:1]
[2] 陈学权. 刑事诉讼中DNA证据运用的实证分析—以北大法意数据库中的刑事裁判文书为对象[J]. 中国刑事法杂志, 2009(4): 105-111. [本文引用:1]
[3] Ginsberg J, Mohebbi MH, Patel RS, et al. Detecting influenza epidemics using search engine query data[J]. Nature, 2009, 457(7232): 1012-1014. [本文引用:1]
[4] Annual statistics: NDNAD, 2010 to 2011[EB/OL. to 2011 [EB/OL]. [2015-01-10]. https: //www. gov. uk/government/publications/ndnad-biennial-report-2009-to-2011. [本文引用:1]
[5] Annual statistics: NDNAD, 2011 to 2012[EB/OL]. to 2012 [EB/OL]. [2015-01-12]. https: //www. gov. uk/government/publications/ndnad-biennial-report-2009-to-2011. [本文引用:1]
[6] NDNAD annual statistics 2012 to 2013[EB/OL]. statistics 2012 to 2013[EB/OL]. [2015-01-12]. https: //www. gov. uk/government/publications/national-dna-database-annual-report-2012-to-2013. [本文引用:1]
[7] National DNA database: annual report, 2013 to 2014[EB/OL]. to 2014[EB/OL]. [2015-01-12]. https: //www. gov. uk/government/publications/national-dna-database-annual-report-2013-to-2014. [本文引用:1]
[8] Lazer D, Kennedy R, King G, et al. The parable of google flu: traps in big data analysis[J]. Science, 2014, 343(6176): 1203-1205. [本文引用:1]