DNA供者族群推断技术在案件中的应用
江丽, 赵蕾, 刘京, 赵雯婷, 马泉, 赵慧, 季安全*, 李彩霞*
公安部物证鉴定中心,北京市现场物证检验工程技术研究中心,现场物证溯源技术国家工程实验室,北京 100038
*通讯作者简介:季安全,男,山东莒县人,硕士,主任法医师,研究方向为法医遗传学。E-mail: agjdna@tom.com

第一作者简介:江丽,女,安徽六安人,博士,副主任法医师,研究方向为法医遗传学。E-mail:jl@mail.bnu.edu.cn

摘要

对于涉外、跨区域流窜犯罪等案件,将现场遗留的生物物证作特征刻画能够为判断侦查方向提供科学依据。利用27-plex SNP族群推断体系及分析流程(能够对来自东亚、欧洲、非洲及其混合人群的DNA样本进行分型检测从而可推断其生物供体的族群来源),本文对一起案件中的死者进行了族群来源推断与分析,为案件破获提供了帮助。

关键词: 法医遗传学; 族群推断; 27-plex SNP族群推断体系
中图分类号:DF795.2 文献标志码:B 文章编号:1008-3650(2019)04-0371-03
DNA Ancestry Inference Assisting to Have a Case Solved
JIANG Li, ZHAO Lei, LIU Jing, ZHAO Wenting, MA Quan, ZHAO Hui, JI Anquan*, LI Caixia*
Institute of Forensic Science, Ministry of Public Security & Beijing Engineering Research Center of Crime Scene Evidence Examination & National Engineering Laboratory for Forensic Science, Beijing 100038, China
Abstract

For the cases having foreigners and/or cross-border/region involved, DNA ancestry inference can harvest valuable information from the biological evidence that was collected at the crime scene, thereby capable of providing investigative clues and facilitating the cases to solve. By exploitation of the 27-plex SNP ancestry inference system, one that is able to genotype the DNA samples and infer whether the ancestral identity of the biological donors is from East Asia, Europe, Africa and admixture populations, the ancestry inference was here conducted into the victims of a case, helping the case to have been successfully solved.

Key words: forensic genetics; ancestry inference; 27-plex SNP ancestry inference panel

DNA来源人族群推断技术不同于常规的微卫星(short tandem repeat, STR)个体识别, 其使用能够反映个体类群信息的单核苷酸多态性(single nucleotide polymorphism, SNP)遗传标记, 可以使法医DNA不仅可“ 比对” 而且能“ 查找” , 是国际法医遗传学领域备受关注的研究热点之一[1, 2]。27-plex SNP族群推断体系经基于94个SNP位点的第一代改进, 能更好地适应法医DNA实验室毛细管电泳检测的需求, 可对未知DNA供者是否来自东亚、欧洲、非洲及欧亚混合人群进行族群来源推断[3, 4, 5, 6, 7]。本文报道DNA来源人族群推断技术在一起案件中的成功应用, 并对该技术方法、内容进行阐述, 为DNA来源人特征刻画提供技术与方法参考。

1 案件简介

2016年某日, 某地发生一起案件, 需确定现场7位死者族源信息。因尸体被火烧, 用传统的法医人类学技术很难获得准确的族群信息。当地公安机关提取肌肉样本送至我中心, 要求进行DNA族群来源推断。

2 族群来源推断
2.1 SNP分型检测

2.1.1 DNA提取

将7人份肌肉组织依次编为1~7号, 用MagAttract DNA Mini M48试剂盒(德国Qiagen)提取样本DNA并定量。稀释DNA至5 ng/μ L。

2.1.2 扩增及延伸反应

使用SNaPshot Multiplex试剂盒(美国Applied Biosystems)5 μ L反应体系, 在ProS PCR仪(德国Eppendorf)上扩增:1)每份样品配制27-plex扩增反应体系, 使用96孔板进行多重PCR反应; 2)对扩增产物直接在原孔中加入纯化试剂纯化; 3)纯化后的产物取1.5 μ L, 加入延伸反应混合物进行延伸; 4)对延伸产物直接在原孔中加入延伸纯化试剂进行纯化。

2.1.3 SNP分型检测

取1 μ L延伸纯化产物与9 μ L甲酰胺与内标的混合液(甲酰胺:内标比例为18∶ 1)混匀离心后, 用ABI 3130xL遗传分析仪(美国Applied Biosystems)电泳检测, 经Genemapper ID v3.2软件分析获得分型。

2.2 族群来源推断分析

本推断方法基于包含全球33个人群2955份样本的基础数据库, 其中21个人群1961份样本分型数据来源于千人基因组, 其余样本来自于本实验室前期收集[3]。根据未知样本在27个SNP位点上的分型进行族群来源推断, 推断结果包含似然比、祖先成分和族群归类图三个方面。使用族群推断软件Forensic Intelligence v1.0计算样本的人群匹配概率(population assignment match probability, AMP)和似然比(likelihood ratio, LR)[5]。用STRUCTURE v2.3.4 软件计算样本的祖先成分比例, 参数设置为:10 000 Burnins, 10 000 Repetitions, 混合模型, 5 interactions; K=3 [8]。用R v3.2.3 进行主成分分析 (principal component analysis, PCA), 并用R程序包ggplot2画出族群归类图 [9, 10]

2.2.1 似然比

LR是对概率证据值的量化。每份样本对应的AMP最高的人群为该样本最可能来源的人群类型。当AMP最高的人群与第二的人群比值LR> 100 时, AMP值最高者为未知个体的来源人群; 当LR≤ 100 时, AMP值的前两位人群均不排除。7份样本在东亚、欧洲、非洲及混合人群中的似然比见表1, 其中1、5、6、7号样本AMP最高的人群均为东亚人群, 且与AMP第二的人群相比LR远大于100; 2、3、4号样本AMP最高的人群均为混合人群。

表1 1~7号样本的似然比值 Table 1 The values of LR (likelihood ratio) from 7 samples

2.2.2 祖先成分

祖先成分是基于27个SNP位点的33个人群基因型数据与待检测样本共同进行聚类分析, 模拟在K=3的情况下使用贝叶斯算法和“ 有放回的重抽样方法” 而推断人群结构, 获得个体祖先成分。基于7份样本的祖先成分见图1, 其中1、5、6、7号样本主成分均为东亚成分, 占90%以上; 2、3、4号样本主成分为欧洲成分同时具有一定比例的东亚成分。

图1 1~7号样本的祖先成分图Fig.1 Ancestral components of each from the 7 samples

2.2.3 族群归类图

族群归类图利用主成分分析对数据进行降维, 将多个具有较强相关性的实测变量综合成少量综合变量, 根据数据在降维后的因子分布进行绘图。7份样本的族群归类图如图2所示, 其中1、5、6、7号样本与东亚人群聚为一类, 2、3、4号样本与混合人群聚为一类。

图2 1-7号样本的族群归类图Fig.2 Population identity by having the 7 samples clustered

综合以上三部分分析内容, 推断结果支持1、5、6、7号样本来源于东亚人群, 2、3、4号样本来源于欧亚混合人群, 不排除3号样本来源于欧洲人群。

检验分析在 8 h内完成, 根据检验结果, 办案单位第二天确定了死者身源。

3 讨论

人类在漫长的迁徙、进化和适应自然过程中, 逐渐形成为具有独特遗传特征的人群。目前人类学通常将人群分为欧洲白种人、非洲黑种人和东亚黄种人[11, 12]。而人群间的婚配、融合又产生了混合人群, 例如主要分布在中国新疆等西北地区的欧亚混合人种(包括维吾尔族、哈萨克族等少数民族等)[13, 14]。族群来源推断技术正是以此为基础, 筛选出人群中特异性的遗传标记, 建立起推断体系和方法。人群间的迁徙、通婚、融合导致群体的遗传成分处于动态变化过程, 故人群间并不存在严格的分界线。因此在进行族群推断时, 就需要综合祖先成分、群体匹配概率的似然比、族群归类图等进行综合判断。最高群体匹配概率对应的人群并不一定就是真正的祖先人群, 具有相似群体匹配概率的人群也不能够被排除。本案例3号样本来源于混合人群的概率是欧洲人群的2.38E+00倍, 是东亚人群的4.62E+13倍, 是非洲人群的3.80E+21倍, 因此不排除3号样本来源于欧洲人群; 而该样本的欧洲成分为90.0%, 东亚成分为7.2%, 说明该样本从祖先来源方面为两种成分的混合。

在案件侦办中, 族群信息直接关系着侦查方向。当检材条件难以用传统法医人类学方法确定族群来源时, DNA族群推断方法可作为新的技术手段提供线索。本实验室根据27-plex SNP 族群推断体系进行检测, 在拿到样本后8 h内即成功推断出样本的族群来源, 为案件侦查及时提供了科学依据。

参考文献
[1] 孙启凡, 赵蕾, 江丽, . DNA来源人特征刻画的法庭科学应用研究[J]. 刑事技术, 2015(3): 232-235. [本文引用:1]
[2] 聂昊, 林子清, 莫晓婷, . DNA来源人种族推断研究进展[J]. 刑刑事技术, 2016(1): 16-19. [本文引用:1]
[3] 江丽, 孙启凡, 马泉, . 27-plex SNP种族推断方法的优化及验证[J] . 遗传, 2017, 39(2): 166-173. [本文引用:2]
[4] WEI Y L, SUN Q F, LI Q, et al. Genetic structure and differentiation analysis of a Eurasian Uyghur population by use of 27 continental ancestry-informative SNPs[J] . International Journal of Legal Medicine, 2016, 130(4): 897-903. [本文引用:1]
[5] WEI Y L, WEI L, ZHAO L, et al. A single-tube 27-plex SNP assay for estimating individual ancestry and admixture from three continents[J] . International Journal of Legal Medicine, 2016, 130(1): 27-37. [本文引用:2]
[6] 刘海渤, 孙启凡, 陈健刚, . 27重SNP种族推断体系准确性验证研究[J] . 中国法医学杂志, 2015, 30(6): 563-566. [本文引用:1]
[7] 魏丽, 魏以梁, 江丽, . 27-plex SNPs复合扩增检测体系构建与应用评价[J] . 中国法医学杂志, 2016, 31(1): 13-17. [本文引用:1]
[8] HUBISZ M J, FALUSH D, STEPHENS M, et al. Inferring weak population structure with the assistance of sample group information[J] . Molecular Ecology Resources, 2009, 9(5): 1322-32. [本文引用:1]
[9] TEAM R D C. R: A language and environment for statistical computing[J] . Computing, 2011, 14: 12-21. [本文引用:1]
[10] WICKHAM H. ggplot2: Elegant graphics for data analysis[M] . Springer Publishing Company, Incorporated, 2009: 180-185. [本文引用:1]
[11] SNOW C C. Forensic Anthropology[M] . New York : Springer US, 1982: 49-67. [本文引用:1]
[12] 张继宗. 法医人类学[M] . 北京: 人民卫生出版社, 2009. [本文引用:1]
[13] 阿布都热合曼·阿布力米提, 陈开旭, 任志娟, . 新疆不同地区维吾尔族人群具有不同的遗传多样性—地域与遗传的关系[C] //中国的遗传学研究. 遗传学进步推动中国西部经济与社会发展——2011年中国遗传学会大会论文摘要汇编2011, 2011. [本文引用:1]
[14] 韩康信. 新疆古代居民的种族人类学研究和维吾尔族的体质特点[J]. 西域研究, 1991(2): 1-2. [本文引用:1]