基于马氏距离算法区分玻璃样品的研究
刘慧娟, 姜华, 王璐
北京市公安局刑侦总队,北京 100054

第一作者简介:刘慧娟(1988—),女,安徽安庆人,硕士,工程师,研究方向为理化检验。E-mail:huijuan0709@163.com

摘要

目的 借助计算机编程来区分玻璃样品。方法 利用激光剥蚀电感耦合等离子体质谱(LA-ICP/MS)方法对200种玻璃样品的42种元素浓度进行测定,通过计算机编程对玻璃样品进行区分。结果 随机抽取70种玻璃样品通过马氏距离算法进行归类,68组数据正确归类,测试结果的准确率达到97%。结论 依据马氏距离算法能够有效区分玻璃样品。

关键词: 激光剥蚀电感耦合等离子体质谱; 玻璃; 马氏距离
中图分类号:DF794.3 文献标志码:A 文章编号:1008-3650(2018)03-0218-04
Distinguishing the Glass Samples by Mahalanobis Distance Algorithm
LIU Huijuan, JIANG Hua, WANG Lu
Beijing Municipal Institute of Forensic Science, Beijing 100054, China
Abstract

Objective To distinguish glass samples by an automated algorithm.Methods The concentrations of 42-kind elements were analyzed from 200-category tested glass samples with LA-ICP/MS method. Mahalanobis distance was used to establish a computer-operated programming algorithm for distinguishing the glass samples.Results Among the 70-catogery glass samples that were randomly selected from the newly-built sample database to classify by mahalanobis distance algorithm, 68 sets of data were sorted out accurately, revealing the distinguishing accuracy up to 97%.Conclusion Glass samples can be effectively distinguished based on Mahalanobis distance algorithm.

Key words: LA-ICP/MS; Glass; Mahalanobis distance

玻璃是现代社会生活中必不可少的物品, 其种类繁多, 用途广泛。由于易碎的特性, 在很多的案(事)件现场都能发现玻璃碎片, 如:交通肇事案、砸车玻璃盗窃案、以玻璃容器为凶器的伤害案等等[1]。现场遗留的玻璃碎片往往与嫌疑物品及嫌疑人有着直接的关联。对于现场所提取的玻璃物证, 现有的检验技术方法(扫描电镜/能谱法、玻璃折射率测定法)存在着灵敏度低、特征元素少, 指标单一的问题, 无法提供更多有效的信息。激光剥蚀电感耦合等离子体质谱法(LA-ICP/MS)可同时检测多元素且灵敏度极
[2], 不仅可以获得玻璃样品的主成分信息, 还能够准确获得大量痕量元素信息, 通过计算机编程对玻璃样品数据进行比对, 可以达到准确快速区分玻璃样品的目的。

1 材料和方法
1.1 样品数据选择

本实验样品收集了市场常见品牌(大众、本田、丰田、奇瑞、奥迪、现代、福特、比亚迪、雪铁龙、标致、夏利、尼桑等)轿车不同部位的玻璃, 其中后视镜玻璃57种、灯罩玻璃17种、风挡玻璃63种、车窗玻璃17种。覆盖市场常见轿车品牌的玻璃种类60%以上。收集了常见日用玻璃46种, 其中包括温度计玻璃、容器玻璃等。收集样品共计200种。

1.2 实验设备

仪器:Newwave UP213固体激光器, Agilent 7500a 型四极杆电感耦合等离子体质谱仪。仪器工作参数见表1

表1 LA-ICP/MS工作条件及参数 Table 1 Working conditions and parameters of LA-ICP/MS

电感耦合等离子体质谱法可同时测定多种元素[3, 4, 5], 本实验用LA-ICP/MS对玻璃样品进行检验[6, 7, 8, 9], 根据玻璃中元素浓度分布的特点和元素的稳定性等因素, 筛选出元素共42种, 将它们的浓度数据作为每个玻璃样品的基础数据, 表2为部分样品数据。

表2 部分样品数据 Table 2 Partial sample data (µ g/g)
1.3 数据处理

激光剥蚀方式采用线扫描, 采样流程如下:预剥蚀(10 s)除去表层污染, 其后依次为载气冲洗(10 s)、激光预热(10 s)、样品剥蚀(70 s)、载气冲洗(10 s)等步骤。玻璃样品分析采用NIST612为外标, 29Si为内标元素来消除基体效应和激光剥蚀效率变化等因素。

对每种玻璃样品进行不少于10次测试, 得到的数据通过STDEV函数计算标准偏差。STDEV函数能够反映数值相对于样品平均值的离散程度, 通过该函数剔除偏离样品均值较大的测试数据, 保留7组有效数据。该检验方法能够采集到大量的元素, 但是如果将一些不稳定元素也纳入数据库, 在进行统计比对计算时反而会使目标数据偏离其应该归属的种类, 因此应先根据样品性质选择合适的元素。在元素选择时主要考虑到以下因素:

1)仪器空白数据中本底值较高的元素, 如P。

2)各样品中含量差异不大的元素, 如Au、Cd。

表2中可以看到Au在各种玻璃样品中元素浓度差异小, 区分度不明显, 应剔除, 同理剔除Cd。

3)在样品重复测试中浓度不稳定的元素, 如Cu、Tl、Sn。Sn在大部分玻璃样品中均出现浓度不稳定的数据, 重复测定浓度差异大, 应剔除, 同理剔除Tl和Cu。

将以上干扰较大及不稳定的元素去除, 最终得到玻璃中元素共42种:Li、Be、B、Mg、K、Sc、Ti、V、Cr、Mn、Fe、Co、Ni、Zn、Ga、Rb、Sr、Y、Zr、Nb、Mo、Cs、Ba、La、Ce、Pr、Nd、Sm、Eu、Gd、Tb、Dy、Ho、Er、Tm、Yb、Hf、Ta、W、Pb、Th、U。

通过对不同玻璃中的42种元素浓度数据进行分析, 确定不同种类玻璃的元素浓度存在差异, 利用此差异, 可以将不同的玻璃样品区分开来。

1.4 建立样品数据库

在7组数据中随机挑选5组, 建立基本的样品数据库, 并对样品数据进行统一编码。将剩下的2组数据放于测试数据库中。通过建立样品数据集和测试数据集对统计比对算法进行测试, 以期选出最有效的算法。

1.5 核心算法实现

本实验中使用距离判别的方法确定测试数据和样品数据是否同一。距离是科学研究与工程技术领域中使用非常广泛的一种度量, 通常被用作衡量两个个体间的相似性[10]。距离判别分析方法是判别样品所属类别的一种应用性很强的多因素决策方法, 根据已掌握的、历史上每个类别的若干样品数据信息, 总结出客观事物分类的规律性, 建立判别准则, 当遇到新的样品点, 只需根据总结得出的判别公式和判别准则, 就能判别该样品点所属的类别。距离判别分析的基本思想是:样品和哪个总体的距离最近, 就判它属于哪个总体。

本实验通过对多种距离判别方法进行测试比对, 选择马氏距离作为主要的判别方法。马氏距离由印度数学家马哈拉诺比斯(Mahalanobis)首先提出, 所以又称为Mahalanobis Distance, 是一种采用协方差来计算两点之间距离的方法。它是一种有效的计算两个未知样品集相似度的方法。马氏距离是多元统计中常用的一种判别方法。马氏距离的定义如下:

定义1:设x, y是从均值向量为μ , 协方差阵为∑ 的总体g中抽取的两个样品, 定义x, y两点之间的马氏距离为:

\[d^2_m(x, y)=(x-y)’ \sum^{-1}(x-y)\]

定义2:x与总体g的马氏距离为:

\[d^2_m(x, g)=(x-\mu)’ \sum^{-1}(x-\mu)\]

马氏距离是建立在协方差的基础上, 它不受量纲的影响, 两点之间的马氏距离与原始数据的测量单位无关; 由标准化数据和中心化数据(即原始数据与均值之差)计算出的二点之间的马氏距离相同。马氏距离还可以排除变量之间的相关性的干扰。马氏距离的优点在于它将协方差作为距离计算的一项因子, 提高了多维向量距离计算的准确度, 但也因为马氏距离增加了协方差的运算, 算法本身的难度也加大。

马氏距离算法实现的流程图见图1。

图1 马氏距离算法实现的流程图Fig.1 Flow chart by Mahalanobis distance algorithm

2 结果

本实验通过LA-ICP/MS法对玻璃样品中元素浓度进行测定, 筛选出42种元素, 利用以马氏距离为核心算法建立的统计比对计算方法, 进行未知玻璃样品与库内样品检索比对。实验前期对200种玻璃样品分别通过LA-ICP/MS进行了7次测定, 其中5次作为样品数据, 另外两组数据作为测试数据证实了方法的可靠性。在此基础上又进一步在样品库里随机抽取了70种样品进行重新实验测定, 表3为部分测试数据。

表3 部分测试数据 Table 3 Partial test data

由于实验的温度、湿度等环境因素对测定结果有一定影响, 所以随机抽取的这70种样品通过马氏距离算法进行归类, 结果显示, 共有68组数据正确归类, 测试结果的准确率达到97%。对算法以软件的形式进行封装, 可以确保操作人员快速、准确地区分玻璃样品(见图2、图3)。

图2 测试结果图Fig.2 The test result

图3 程序应用软件操作界面Fig.3 Interface of applications software

3 结论

本实验采用激光剥蚀/电感耦合等离子体质谱技术对玻璃中的常量、微量及痕量元素浓度进行了测定。通过对不同玻璃样品中元素浓度数据的分析, 确定不同的玻璃在其元素浓度上存在差异, 利用此差异可以将不同的玻璃样品进行区分。以马氏距离为核心算法建立的统计比对计算方法软件能够快速、准确地区分玻璃样品, 实现未知玻璃样品种类等来源信息的快速认定。这种将先进检测方法和合理数学模型的有机结合, 可以对案件中相关物证进行快速区分, 有利于案件的快速侦破、事故责任的认定, 在理化检验专业定量分析数据模式的建立中起到关键作用, 因此本文的研究成果在实际案件中具有较强的应用性。

The authors have declared that no competing interests exist.

作者已声明无竞争性利益关系。

参考文献
[1] 刘伟兵. 玻璃中痕量金属元素检测方法研究[J]. 刑事技术, 2012(4): 13-14. [本文引用:1]
[2] 吴石头, 王亚平, 许春雪. 激光剥蚀电感耦合等离子体质谱元素微区分析标准物质研究进展[J]. 岩矿测试, 2015, 34(5): 503-511. [本文引用:1]
[3] 王小如. 电感耦合等离子体质谱应用实例[M]. 北京化学工业出版社, 2005: 146-150. [本文引用:1]
[4] 颜敏, 刘园园, 贺瑞玲, . ICP-MS法测定药用玻璃容器中13种元素的浸出量[J]. 药物分析杂志, 2016(1): 133-137. [本文引用:1]
[5] 郭洪玲, 乔婷, 宋小娇, 等 . 电感耦合等离子体质谱在微量物证检验中的应用[J]. 刑事技术, 2016, 41(6): 470-475. [本文引用:1]
[6] 斯琴毕力格, 李青会, 干福熹. 激光剥蚀-电感耦合等离子体-原子发射光谱/质谱法分析中国古代钾玻璃组分[J]. 分析化学, 2013, 41(9): 1328-1333. [本文引用:1]
[7] TATIANA T, ROBERT K, STEFAN B. Cross-validation and evaluation of the performance of methods for the elemental analysis of forensic glass by μ-XRF, ICP-MS and LA-ICP-MS[J]. Analytical and Bioanalytical Chemistry, 2013, 405(16): 5393-5409. [本文引用:1]
[8] TREJOS T, ALMIRALL JR. Sampling strategies for the analysis of glass fragments by LA-ICP-MS. Part I: Micro-homogeneity study of glass and its application to the interpretation of forensic evidence[J]. Talanta, 2005, 67(2 ): 388-395. [本文引用:1]
[9] TREJOS T, ALMIRALL JR. Sampling strategies for the analysis of glass fragments by LA-ICP-MS. Part II: Sample size and sample shape considerations[J]. Talanta, 2005, 67(2): 396-401. [本文引用:1]
[10] 王学仁. 实用多元统计分析[M]. 上海科学技术出版社, 1990: 41-60. [本文引用:1]