法医SNP系谱推断技术助破14年久冷案
刘京1,2, 马咪3, 魏以梁4,5, 李鹰翔5, 江丽1, 王桂强1, 叶健1, 季安全1,*, 李彩霞1,*
1.公安部物证鉴定中心,法医遗传学公安部重点实验室,现场物证溯源技术国家工程实验室,北京 100038
2.中国政法大学,证据科学教育部重点实验室,北京 100088
3.新疆生产建设兵团第七师公安局,新疆 奎屯 833200
4.江苏师范大学生命科学学院,江苏省系统发育与比较基因组学重点实验室,江苏 徐州 221116
5.安澜智能﹝深圳﹞有限公司,广东 深圳 510630
* 通信作者简介:季安全,男,山东莒县人,硕士,主任法医师,研究方向为法医遗传学。E-mail: aqjdna@163.com;李彩霞,女,山西曲沃人,博士,主任法医师,研究方向为法医遗传学。E-mail: licaixia@tsinghua.org.cn

第一作者简介:刘京,男,山东沂水人,硕士,主检法医师,研究方向为法医遗传学。E-mail: biojing@yeah.net

摘要

男性家族排查是目前法医DNA办案工作中的重要手段,但是同一父系几或十数代男性的Y-STR基因分型可能都相近甚至一致,若在全国范围内很可能比中不同地区的多个家系,当无法甄别所有比中家系与嫌疑人的亲缘关系远近时,办案单位就很难确定重点调查家系,而全部摸排则费时耗力。近期,公安部物证鉴定中心研发出了法医SNP系谱推断技术,通过检测和分析全基因组数据,可预测父系和母系的1~7级亲缘关系(高祖至玄孙,即五服),且能分析关系远近。将该技术与族群分析运用于一起长达14年未破的强奸杀人案,帮助办案单位确定了嫌疑人的地域来源、所在家系等信息,为案件的侦破提供了关键技术支撑。

关键词: 法医遗传学; 法医系谱学; DNA表型特征刻画; 亲缘关系分析; 冷案
中图分类号:DF795.2 文献标志码:A 文章编号:1008-3650(2021)06-0652-05
Forensic SNP Genealogical Inference Helping Ferret out a 14-year-long Unsolved Cold Case
LIU Jing1,2, MA Mi3, WEI Yiliang4,5, LI Yingxiang5, JIANG Li1, WANG Guiqiang1, YE Jian1, JI Anquan1,*, LI Caixia1,*
1. Institute of Forensic Science, Ministry of Public Security (MPS) & MPS' Key Laboratory of Forensic Genetics & National Engineering Laboratory for Forensic Science, Beijing 100038, China
2. Ministry of Education's Key Laboratory of Evidence Science & China University of Political Science and Law, Beijing 100088, China
3. Public Security Bureau of Seventh Division of Xinjiang Production and Construction Corps, Kuitun 833200, Xinjiang, China
4. School of Life Sciences, Jiangsu Normal University & Jiangsu Provincial Key Laboratory of Phylogenomics and Comparative Genomics, Xuzhou 221116, Jiangsu, China
5. AnLan AI [Shenzhen] Ltd., Shenzhen 510630, Guangdong, China
Abstract

Y-STR familial screening is at present an important resort for investigating male suspects with forensic DNA cases. However, the same paternal lineage may maintain the similar or identical Y-STR genotype for several or even dozens of generations, resulting in eligible matches falling into multiple paternal families in different regions nationwide. Nevertheless, Y-STR is incapable of analyzing the distance of kinship between all matched families and the suspect so that the relevant local police will be difficult to determine the target family because investigating all the matched families is both time-consuming and waste of resources. Recently, a SNP genealogy inference technology has been developed with Institute of Forensic Science, Ministry of Public Security, able to predict genetic kinship boastfully from 1st- to 7th- generation tiers through the genome-wide SNP data. As thus, such a technology, combined with the ancestry inference, was applied to investigating into a 14-year-long unsolved cold case of rape and murder, having assisted the local police to successfully determine the biogeography and family information of the suspect so as to provide key technical support for the case to resolve.

Key words: forensic genetics; forensic genealogy; DNA-based characterization portrayal; kinship analysis; cold case

使用常染色体STR进行个体识别是目前公安破案的常用手段。当现场物证DNA无法与嫌疑人比对时, 亦可使用Y染色体STR进行家系排查[1, 2], 但是同一父系几或十数代的Y-STR分型可能都相同或相近, 在全国范围内有可能比中多个大家系。DNA特征刻画技术可以分析现场DNA来源人的族群地域、家族系谱、体貌特征等, 能为案件提供线索。其中, 法医SNP系谱推断, 国外也称法医遗传系谱学(forensic genetic genealogy, FGG)、侦查系谱学(investigative genetic genealogy, IGG), 是通过遗传谱系分析解决涉及司法实践中身份识别的问题[3]。通过DNA与涉案人员的家族成员关联起来, 绘制家族系谱树, 进而找到涉案人员。公安部物证鉴定中心所属我项目组研发的法医SNP系谱推断技术, 可通过检测和分析全基因组SNP数据预测父系和母系7级以内的亲缘关系(高祖到玄孙, 即五服, 见图1)。运用该技术可以从Y-STR比中的几十代遗传的父系大家系中找到两百年以内的近代小家系, 进而锁定目标家系, 节省人力物力, 加快案件侦破。

图1 法医系谱亲缘关系等级[3]Fig.1 Generation-oriented consanguinity hierarchies with forensic genealogy[3]

1 材料和方法
1.1 简要案情和前期检验情况

2006年, 新疆兵团某师辖区发生一起强奸杀人案, 受害人为一女性出租车司机, 现场嫌疑人的DNA分型录入DNA数据库未比中。2020年5月, 办案单位检验男性41个Y染色体STR, 比中5个省市的11个家系, 其中湖北1家、安徽1家、江苏2家、重庆6家、四川1家。所有人员样本均为自愿提供。

1.2 DNA提取与检测

1.2.1 DNA提取

现场提取的生物检材用MagAttract® DNA Mini M48试剂盒(QIAGEN公司, 德国)进行DNA提取和纯化, 用NanoDrop 2000C分光光度计(Thermo Scientific公司, 美国)进行定量。

1.2.2 SNP分型检测

使用项目组研发的74-SNP全球十个区域族群推断体系[4, 5]及Y-SNP单倍群检测体系[6]检测现场DNA, 获得74个常染色体SNP分型和74个Y染色体SNP分型。使用美国Illumina Infinium Global Screening Array(GSA)芯片进行全基因组SNP检测, 获得约70万个常染色体SNP位点分型(安澜智能公司, 中国)[7]

1.3 数据分析方法

1.3.1 74-SNP全球十个区域族群推断和Y-SNP单倍群数据分析

针对74-SNP检测结果, 使用项目组前期开发的DNA族群推断系统软件(DAA)[8]计算样本的人群匹配概率(population assignment match probability, AMP)和似然比(likelihood ratio, LR), 以及样本的族群成分比例, 参数设置为:K=10, 10 000 Burnins, 10 000 MCMC, run=10。针对Y-SNP单倍群, 基于Y-SNP谱系树, 根据样本在Y-SNP位点上的分型判断其所属单倍群类别。

1.3.2 法医SNP系谱推断分析

使用项目组开发的法医SNP系谱推断分析算法:首先将全基因组SNP检测结果转换为指定格式, 然后进行同源染色体分离计算, 计算目标样本间的共祖片段的长度和数量, 最后据此计算出他们之间的亲缘关系等级。

2 结果
2.1 SNP族群推断划定地域范围

案发已历时14年之久, 当时恰逢新疆棉花手工采摘期, 案发地为多民族多地域人群混居, 而Y-STR比中多地家系, 急需对嫌疑人进行特征刻画, 缩小排查范围。74-SNP全球十大区域族群推断方法的结果显示:案件样本来源于汉族等东亚人群可能性较大, 排除欧亚混合人群。Y-SNP单倍群为O2下游的O2a1c1b-F449, 该单倍群多分布于广西、四川、重庆、西藏等中国西南地区。

2.2 SNP系谱推断锁定家系

办案单位基于SNP族群推断结果将摸排重点首先放在重庆、四川。其中, 重庆市刘姓家系非常庞大, 有大量分支, 人数约16万之多。办案单位开展了大规模摸排, 未取得进展。另外排查出四川的唐姓家系检验获得3种Y-STR分型, 只有唐某的Y-STR分型与嫌疑人一致, 但是常染色体STR检验均排除与嫌疑人一致。为确定重点排查家系, 办案单位选择Y-STR零容差的刘姓3家系和唐某的样本共计29份, 进行SNP系谱推断分析。经分析, 推断唐某与嫌疑人有7级亲缘关系(IBD片段数量为3, 总长度为66 cM), 而其他家系与嫌疑人均无7级以内亲缘关系。据此, 唐某相关的家族成员被确定为重点摸排对象, 经侦查摸排确定其生父是远在重庆的刘某。经SNP系谱推断出刘某与嫌疑人是6级亲缘关系(IBD片段数量为8, 总长度为154 cM)。据此, 办案单位采集刘姓家系的36名男性成员样本, 如图2, 经常染色体STR检验发现其中一份样本分型与现场DNA完全一致, 嫌疑人被抓获后如实交代了犯罪事实, 该命案(公安部督办)历时14年告破。

图2 嫌疑人所在的家系图Fig.2 The pedigree targeted of the suspect

3 讨论

早在1970年剑桥大学的Thompson提出通过检测个体之间共享的等位基因可判定亲缘关系[9]。1983年Donnelly提出有亲缘关系的个体之间共享基因组片段, 通过检测共享片段可预测亲缘关系[10]。这些研究为现代遗传系谱学奠定了基础。2005年美国科学家Fitzpatrick提出法医系谱学的概念, 用于描述复杂亲缘关系在司法鉴定中的应用。法医SNP系谱推断技术是生物大数据时代的新兴法医DNA技术, 可在没有比对对象时, 将SNP数据上传到非公安系统的社会数据库, 调动社会资源服务于案件侦破。2018年美国警方利用法医SNP系谱推断技术破获“ 金州杀手案” [11], 该技术现已列为美国警方破获冷案积案的手段之一, 截至2020年底已在数千起案件中应用, 破获积案百余起。美国司法部[12]和FBI的DNA专家工作组(SWGDAM)[13]先后出台了SNP系谱推断技术应用指南。

法医SNP系谱推断技术也可用于在Y-STR比中的大家系中锁定重点小家系, 本案的成功告破即为该应用模式。通过预测嫌疑人与比中家系代表样本之间亲缘关系的远近, 锁定或排除家系, 显著减少了大规模摸排的样本检验量, 在本案中SNP系谱推断共计检验了29份样本就锁定了家系, 避免了成千上万份样本的常染色体STR大规模检测排查。此外, SNP族群推断技术在本案侦查中从Y-STR比中的五省市中确定了重庆和四川, 避免了逐个省份多个家系的摸排。图3为本案侦破的全流程, 可总结为如下四个步骤:Y-STR比中多地大家系、SNP族群推断划定区域、SNP系谱推断锁定小家系、常染色体STR确认嫌疑人。SNP族群、系谱等刻画技术的应用, 将成为我国继国家法庭科学DNA数据库和男性家族排查系统之后的又一种新手段, 助力案件侦破。

图3 案件侦破流程Fig.3 Investigation process of the case solved with help of the approach described in this article

参考文献
[1] 拜永强, 黄河, 张颖, . 尸体颈部扼痕擦拭物检验Y-STR 破案1例[J]. 刑事技术, 2014, 39(4): 6.
(BAI Yongqiang, HUANG He, ZHANG Ying, et al. A case solved by Y-STR examination from the swab of strangler's mark on corpse's neck[J]. Forensic Science and Technology, 2014, 39(4): 6. ) [本文引用:1]
[2] 孟庆振, 周如华, 陈维忠, . 由一起命案浅谈Y-STR应用新模式[J]. 刑事技术, 2016, 41(6): 504-506.
(MENG Qingzhen, ZHOU Ruhua, CHEN Weizhong, et al. Discussing a new model of Y-STR application from a murder case[J]. Forensic Science and Technology, 2016, 41(6): 504-506. ) [本文引用:1]
[3] 刘京, 季安全, 李彩霞, . 法医系谱分析研究进展[J]. 刑事技术, 2019, 44(3): 189-194.
\(LIU Jing, JI Anquan, LI Caixia, et al. Research progress of forensic genealogy analysis[J]. Forensic Science and Technology, 2019, 44(3): 189-194. ) [本文引用:1]
[4] 刘杨, 孙昌春, 马咪, . 74-plex SNPs复合检测体系在中国人群中的族群推断研究[J]. 遗传, 2020, 42(3): 296-308.
(LIU Yang, SUN Changchun, MA Mi, et al. The ancestry inference of Chinese populations using 74-plex SNPs system[J]. Hereditas, 2020, 42(3): 296-308. ) [本文引用:1]
[5] LI C, PAKSTIS A J, JIANG L, et al. A panel of 74 AISNPs: improved ancestry inference within Eastern Asia[J]. Forensic Science International: Genetics, 2016, 23: 101-110. [本文引用:1]
[6] 钱恩芳, 吴文静, 王磊, . Y-STRs和Y-SNPs综合分析方法在父系家系调查中的应用[J]. 南京医科大学学报(自然科学版), 2019, 39(8): 1135-1141.
(QIAN Enfang, WU Wenjing, WANG Lei, et al. Comprehensive analysis of Y-STRs and Y-SNPs in paternal lineage identification[J]. Journal of Nanjing Medical University (Natural Sciences), 2019, 39(8): 1135-1141. ) [本文引用:1]
[7] ADLER A J, WILEY G B, GAFFNEY P M. Infinium assay for large-scale SNP genotyping applications[J]. Journal of Visualized Experiments, 2013(81): e50683. [本文引用:1]
[8] 刘京, 李盛, 江丽, . 对于未知来源个体进行族群推断的自动分析系统[J]. 生命科学研究, 2018, 22(1): 3-7.
(LIU Jing, LI Sheng, JIANG Li, et al. DNA ancestry analyzer: an automatic program for ancestry inference of unknown individuals[J]. Life Science Research, 2018, 22(1): 3-7. ) [本文引用:1]
[9] THOMPSON E A. The estimation of pairwise relationships[J]. Annals of Human Genetics, 1975, 39(2): 173-188. [本文引用:1]
[10] DONNELLY K P. The probability that related individuals share some section of genome identical by descent[J]. Theoretical Population Biology, 1983, 23(1): 34-63. [本文引用:1]
[11] PHILLIPS C. The Golden State Killer investigation and the nascent field of forensic genealogy[J]. Forensic Science International: Genetics, 2018, 36: 186-188. [本文引用:1]
[12] The United States' Department of Justice Announces. Forensic genetic genealogical DNA analysis and searching[Z]. 2019. [本文引用:1]
[13] Scientific Working Group on DNA Analysis Methods (SWGDAM). Overview of investigative genetic genealogy[Z]. 2020. [本文引用:1]