泥土物证XRF元素定量检验数据比对评价方法比较
郭洪玲, 王萍, 朱军, 胡灿, 梅宏成, 郑继利
公安部物证鉴定中心,北京 100038

第一作者简介:郭洪玲,女,山东泰安人,博士,研究员,研究方向为理化检验。 E-mail: guohongling1234@163.com

摘要

目的 在微量物证领域,元素分析是进行泥土物证检验的有效手段之一,X射线荧光光谱法(XRF)具有分析速度快、检验无损、可进行无标样分析等特点在泥土物证的比对检验中应用广泛。但是针对两个样品间多维泥土元素检验数据的相似性评价一直是困扰微量物证工作者的一个难题。本文旨在对比欧氏距离和Hotelling T2这两种统计学方法在评价样品检验数据差异性方面的准确性。方法 采用XRF法对泥土样品进行10种元素定量分析,采用欧氏距离和Hotelling T2两种方法对检验数据进行统计处理,比较两种方法在评价两个样品间相似性时的差异。结果 欧氏距离和Hotelling T2 法在处理20个(190组)不同来源的泥土样品之间的两两比对时,不可区分率分别为4.21%和7.37%。结论 欧氏距离和Hotelling T2 两种多参数数据比对检验法均可用于泥土物证XRF定量检验数据间相似性评价,两种方法各有特点,在实际应用中要注意其使用条件和前提,才能保证统计结果的准确性。

关键词: 理化检验; 泥土物证; X射线荧光光谱; 比对检验; 欧氏距离; Hotelling T2
中图分类号:DF794.3 文献标志码:A 文章编号:1008-3650(2020)06-0568-04
Comparison of Two Statistical Methods for Evaluating XRF-based Elemental Quantitative Data of Soils
GUO Hongling, WANG Ping, ZHU Jun, HU Can, MEI Hongcheng, ZHENG Jili
Institute of Forensic Science, Ministry of Public Security, Beijing 100038, China
Abstract

Objective XRF (X-ray fluorescence spectrometry) possesses many advantages for soil elemental quantitative analysis, yet leaving difficulties to evaluate similarity/difference between sampling soils with the received analysis data. Thus, two methods, Euclidean Distance and Hotelling T2 - both of which are the statistical approaches to compare inter-sample similarity/difference, were adopted to evaluate their accuracy in comparison of data similarity/difference.Methods XRF was used to analyze the concentrations of 10 elements in 20 sampling soils collected from different locations, having the relevant data obtained. The methods of Euclidean Distance and Hotelling T2 were carried out to assess the difference between the data from sampling soils.Results With the 20 soil samples and their resultant 190 pairs of comparison, Euclidean Distance approach gave its indistinguishable rate as 4.21%, and Hotelling T2 7.37%.Conclusions Both Euclidean Distance and Hotelling T2 are applicable to statistically evaluate inter-soil samples. Yet, proper selection and execution of the statistical processing should be based on the prerequisites of the methods, thereby leading to acceptable results for sample comparison.

Key words: physical and chemical analysis; soil; XRF; comparison; Euclidean Distance; Hotelling T2

在案件中, 泥土物证经常附着于与现场相关的各类物体(如作案工具)和嫌疑人衣物上, 成为微量物证领域重要的物证之一。通过泥土物证间的比对检验, 如通过犯罪嫌疑人鞋底或作案工具上附着泥土与已知来源泥土的比对检验[1, 2, 3, 4, 5, 6], 可以建立嫌疑人与现场的关联。但如何对比对检验结果进行准确评价, 即通过检验数据进行两个样品间的相似性的准确评价一直是困扰微量物证工作者的难题。

常用于两个样品间均值比较的数据统计方法包括student′ s t检验法、3倍标准偏差法、最大极差法、欧氏距离法和Hotelling T2[7, 8]。其中student′ s t检验、3倍标准偏差和最大极差法通常用于数据满足正态分布的不同样品间单参数均值的比较。对于多参数检验数据, 这些方法的适用性并不强, 多个单参数评价结果错误率的多次累加会使得样品间相似性评价的错误率大大上升[8]。欧氏距离和Hotelling T2法更加适合样品间多参数检验数据的均值相似性的比较, 该两种方法在玻璃物证的检验数据评价中报道较多[9, 10]。本文在对泥土标准样品和实际提取的泥土样品进行元素分析的基础上, 对得到的检验数据采用欧氏距离和Hotelling T2两种方法进行处理, 通过计算样品间不可区分率来对两种方法进行比较和评价。

1 材料与方法
1.1 实验样品

本实验所用的泥土样品及详细信息见表1

表1 实验样品信息 Table 1 Information of experimental samples
1.2 实验仪器

1.2.1 X射线荧光光谱仪

ZSX100e型波长色散X射线荧光光谱仪(日本理学), 端窗铑靶X射线光管(4 kW), 30 μ m超薄Be窗, 最大工作电压60 kV, 最大工作电流150 mA。

1.2.2 压片机

BP-1型粉末压片机(丹东北方科学仪器有限公司)。

1.2.3 研磨机

PM200行星式球磨仪(德国莱驰)。

1.3 实验方法

1.3.1 样品前处理方法

将所有泥土样品在105 ℃烘箱中烘干2 h。烘干后样品轻轻碾碎后过20目筛, 过筛的部分在玛瑙罐中以450 r/min转速用球磨仪研磨10 min, 最终所有样品全部过200目筛。分别取研细的泥土样品4 g, 用32 mm直径的PVC压样环在30 MPa的压力下压片成型, 每个样品至少平行制作5个压片。

1.3.2 X射线荧光光谱分析法

案件中往往由于检材量较少, 不得不使用较小的视野光栏, 但同时为保证分析结果的准确性, 又不能太小, 因此本实验采用10 mm视野光栏对样品进行分析。采用两套国家泥土标准物质GSS1-8和GBW(E)070041-070046建立Al2O3、SiO2、Fe2O3、K2O、Na2O、MgO、CaO、P2O5、MnO、TiO2 10种矿质全量元素的外标标准曲线, 各元素外标曲线的相关系数均大于0.95。利用建好的外标曲线对所有实验样品进行10种元素含量测定。

2 结果与讨论
2.1 泥土样品XRF定量分析数据

实验中, 为避免样品不均匀性给检验结果带来差异, 选用GSS6和GSS25两个标准样品衡量仪器波动产生的检验数据的差别, 两个标准样品分别进行10次平行测量, 结果见补充材料表S1。从不同采样点提取的泥土的检验结果(5次平行检验结果的平均值)见补充材料表S2。

2.2 欧氏距离法处理泥土物证XRF定量分析数据

欧氏距离(Euclidean Distance)是距离分析的一种, 是对变量之间相似或不相似程度进行评估的一种方法, 特征距离越小越相似, 越大差别越大, 它是针对连续性等距变量数据进行距离分析的一种。欧氏距离的计算公式如下:

(1)

D— 第1个和第2个样品之间的距离; Xi1— 第1个样品的某一元素i的取值; Xi2— 第2个样品该元素i的取值; n— 所有元素个数。

采用SPSS软件中距离分析功能对本实验样品分析数据按照差异程度不同, 分层次进行距离分析。第一层次是同一样品平行多次的检验数据, 第二层次是从不同采样地点提取的样品的检验数据。首先评价第一层次的检验数据。从采用欧氏距离法对GSS6和GSS25两个样品内部数据进行统计的结果中看出(结果见补充材料表S3、S4), 同一样品重复分析数据之间的欧氏距离值均小于1。用同样的方法, 对从不同地点采集的泥土样品的检验数据进行欧氏距离分析结果看出(见补充材料表S5), 对不同地点提取的20份泥土样品进行两两比对, 有=190组, 其中8组样品无法通过10种矿质全量元素XRF分数据进行区分(表S5中红字标出的数据), 不可区分率为4.21%。

2.3 Hotelling T2处理泥土物证XRF定量分析数据

Hotelling T2检验是t分布的二元自然推广, 常用于进行两组均向量间的比较。假设两个样本均有m个变量(在该实验中有10个变量), 样本的均值为μ i=(μ i1, μ i2, …, μ im)T, i=1, 2。数据矩阵为{xijk, i=1, 2; j=1, 2, …, ni; k=1, 2, …, m}, ni是样本数量(本实验指样品重复分析的次数), i=1, 2。平均值向量为, i=1, 2, 这里, i=1, 2, k=1, …, p。两个假设分别为H0:(μ 11, μ 12, …, μ 1m)=(μ 21, μ 22, …, μ 2m), H1:(μ 11, μ 12, …, μ 1m)≠ (μ 21, μ 22, …, μ 2m

Hotelling T2的统计计算公式如下:

(2)

这里S是合并方差-协方差矩阵, 即

(3)

其中S1S2分别为两个样本内不同元素间的方差-协方差矩阵, n1n2表示两个样品进行重复检验的次数。不同元素间的方差-协方差矩阵Sii=1, 2)计算公式如下:

(4)

而其中协方差cov(x, y)的计算公式如下:

(5)

求得Hotelling T2统计值后, 可查相应界值表得到P值(显著性概率), 从而得出结论。通常, 若P>0.05, 则接收原假设H0, 认为两个样本均值向量无显著性差异; 若P< 0.05, 则拒绝原假设H0, 接收假设H1, 认为两个样本均值向量有显著性差异。在实际应用中, 通常将T2统计量转换为统计量F, 再由F分布得到P值。

F值与Hotelling T2统计量的关系式如下:

(6)

进行Hotelling T2检验需要数据符合正态分布, 因此, 首先第一步对样品XRF分析数据进行正态性检验。Kolmogorov-Smirnov(简写为KS)检验是基于累积频率分布, 检验样本分布是否符合某种理论分布拟合优度的检验方法。利用样本累积频率分布与理论分布的偏离值, 来检验样本分布与理论分布是否匹配。当KS统计量显著性水平大于临界值0.05时, 认为该样本符合理论分布。本文采用KS法检验泥土样品元素含量数据是否符合正态分布。表2为GSS6、GSS25和不同采样地点泥土样品的KS检验结果, 由表中数据可以看出, 除P2O5和MnO两个参数(表中红色标出的数据)外, 其他参数均符合正态分布。在进行XRF分析时, P2O5和MnO两个氧化物的元素含量较低, 在多次重复分析时, 其标准偏差值很小, 导致其数据不符合正态分布。

表2 不同种样品的Kolmogorov-Smirnov检验结果 Table 2 Kolmogorov-Smirnov test for different soil samples

按照进行欧氏距离分析的层次对样品10种元素的XRF分析数据进行Hotelling T2检验。本论文采用SPSS中的一般线性模型计算得出P值。首先对两个样品平行多次的检验数据进行Hotelling T2检验。将GSS6和GSS25样品平行10次分析数据分成两组(前5个数据为第1组, 后5个数据为第2组), 然后进行两组数据均值向量的Hotelling T2检验, 得到P值分别为0.360和0.185, 均大于0.05, 因此, 同一样品多次平行分析数据的均值向量间无显著性差异。用同样的方法, 对从不同采样地点提取的20个样品的XRF数据进行两两Hotelling T2检验, 检验结果的P值见补充材料表S6。

通过Hotelling T2检验, 从不同地点提取的20份泥土样品进行两两比对的190组中有14组P值大于0.05, 即无法通过10种矿质全量元素XRF分析数据进行区分(表中红字标出的数据), 不可区分率为7.37%。与欧氏距离法相比, 其不可区分率略高。值得注意的是进行Hotelling T2检验要求n1+n2P+1, 即要求两个样品重复测量次数之和要大于检验参数个数加1, 因此, 在实际使用该方法时, 如果样品量允许, 要进行多次测量, 保证检验数据标准偏差的稳定性。

3 结论

本文比较了常用于两个样品间多参数检验数据比对的欧氏距离法和Hotelling T2法处理XRF定量检验泥土数据的应用效果。从比较结果看, 欧氏距离法和Hotelling T2法在处理相同来源的泥土样品XRF定量检验数据时, 结果比较一致; 在处理不同来源的泥土样品XRF定量检验数据时不可区分率相当。但是, 欧氏距离法会受检验参数个数以及检验量纲的影响, 在确定区分不同样品临界值时, 对所用的样品本身均匀性的依赖较大。而Hotelling T2则要求两个进行比对检验的样品内部平行分析的总次数要大于检验参数的个数加1, 这在样品量比较少的物证分析中会有困难。两种多参数数据比对检验的统计方法各有特点, 在实际应用中要注意其使用条件和前提。

补充材料

本文补充材料文件见:http://www.xsjs-cifs.com/CN/volumn/home.shtml

参考文献
[1] WOODS B, KIRKBRIDE K P, LENNARD C, et al. Soil examination for a forensic trace evidence laboratory - part 2: elemental analysis[J]. Forensic Science International, 2014, 245: 195-201. [本文引用:1]
[2] JANTZI S C, ALMIRALL J R. Elemental analysis of soils using laser ablation inductively coupled plasma mass spectrometry (La-ICP-MS)and laser-induced breakdown spectroscopy (LIBS) with multivariate discrimination: tape mounting as an alternative to pellets for small forensic transfer specimens[J]. Applied Spectroscopy, 2014, 68: 963-974. [本文引用:1]
[3] FITZPATRICK R W. Soils [M]// SIEGEL J A, SAUKKO P J. Encyclopedia of Forensic Sciences. 2nd ed. Massachusetts: Academic Press, 2013: 206-212. [本文引用:1]
[4] REIDY L, BU K, GODFREY M, et al. Elemental fingerprinting of soils using ICP-MS and multivariate statistics: a study for and by forensic chemistry majors[J]. Forensic Science International, 2013, 233: 37-44. [本文引用:1]
[5] 郭洪玲, 王萍, 朱军, . 法庭地质学与泥土物证检验[J]. 刑事技术, 2019, 44(1): 53-59.
(GUO Hongling, WANG Ping, ZHU Jun, et al. Forensic geology and soil examination[J]. Forensic Science and Technology, 2019, 44(1): 53-59. ) [本文引用:1]
[6] 黎乾, 权养科. 泥土物证检验技术的现状及发展[J]. 刑事技术, 2010, 35(6): 25-28.
(LI Qian, QUAN Yangke. Present status and prospect of soil evidence examination[J]. Forensic Science and Technology, 2010, 35(6): 25-28. ) [本文引用:1]
[7] PAWLUK C M, ZIE B J, PARCZEWSKI A. Application of false discovery rate procedure to pairwise comparisons of refractive index of glass fragments[J]. Forensic Science International, 2006, 160(1): 53-58. [本文引用:1]
[8] GRZEGORZ Z, AGNIESZKA M, RAMOS D, et al. Statistical analysis in forensic science: evidential value of multivariate physicochemical data[M]. West Sussex, England : Wiley, 2005. [本文引用:2]
[9] 郭洪玲, 权养科, 陶克明. 法庭科学中泥土物证XRF检验数据的分析研判[J]. 中国司法鉴定, 2013(3): 24-28.
(GUO Hongling, QUAN Yangke, TAO Keming. Data analysis of elemental examination of soil evidence by XRF in forensic science[J]. Chinese Journal of Forensic Sciences, 2013(3): 24-28. ) [本文引用:1]
[10] CURRAN J M, HICKS T N, BUCKLETON J S. Forensic interpretation of glass evidence[M]. US Florida: CRC Press, 2000. [本文引用:1]