基于稀疏编码与反向索引的鞋印图像比对算法

引用本文

李大湘, 邱鑫, 刘颖. 基于稀疏编码与反向索引的鞋印图像比对算法[J].刑事技术, 2018,43(4):282-287
LI Daxiang, QIU Xin, LIU Ying. Shoeprint Image Matching Algorithm Based on Sparse Coding and Invert Indexing[J]. Forensic Science and Technology,2018,43(4): 282-287 复制到剪切板

doi: 10.16467/j.1008-3650.2018.04.005
Permissions

《刑事技术》编辑部

基于稀疏编码与反向索引的鞋印图像比对算法

李大湘^1,², 邱鑫^1,^*, 刘颖^1,²

1.西安邮电大学通信与信息工程学院,西安 710121

2.电子信息现场勘验应用技术公安部重点实验室,西安 710121

* 通讯作者：邱鑫（1992—）,女,陕西商洛人,硕士研究生,研究方向为刑侦图像检索与分类。E-mail：2531343221@qq.com

第一作者简介：李大湘（1974—）,男,湖南麻阳人,博士,副教授,研究方向为刑侦图像处理与分析。E-mail：35108809@qq.com

基金资助: 陕西省国际合作交流项目（No. 2017KW-013）; 公安部科技强警基础工作专项项目（No. 2014GABJC022）; 中国博士后科研基金项目（No. 2013M542386）

摘要

针对刑侦工作中大规模鞋印图像库的查询应用需求,提出一种基于稀疏编码与反向索引的快速比对算法。首先,对鞋印图像进行视觉增强、中值滤波与二值分割等预处理,并提取其尺度不变特征变换（SIFT）特征;然后,基于聚类字典构造、稀疏编码（SC）与最大池化等方法,计算鞋印图像的稀疏编码特征;最后,通过构建“词-图像矩阵”而建立每个视觉单词的反向索引（RI）表,并据此提出一种SC-RI鞋印图像比对新算法。基于 16 343幅真实鞋印图像的试验结果表明,SC-RI算法完成一次比对平均耗时约为121.26ms,较之传统SIFT匹配穷举比对方法,其速度提高了140多倍,且局部花纹比对TOP 20正确率可达到95.3%。

关键词: 鞋印图像比对; 稀疏编码; 反向索引; 局部特征提取

中图分类号:DF794.1 文献标志码:A 文章编号:1008-3650(2018)04-0282-06

Shoeprint Image Matching Algorithm Based on Sparse Coding and Invert Indexing

LI Daxiang^1,², QIU Xin^1,^*, LIU Ying^1,²

1. School of Telecommunication and Information Engineering, Xi’an University of Posts and Telecommunications, Xi’an 710000, China;

2.Ministry of Public Security’s Key Laboratory of Electronic Information Application Technology for Scene Investigation, Xi’an 710072, China);

Abstract

Focused at the query application into the large-scale shoeprint image library for criminal investigation, a fast matching algorithm, based on sparse coding and invert indexing, was proposed here. Firstly, the shoeprint images were pre-processed by the manipulation of visional enhancement, median-value filter and binary segmentation so as to extract the Scale Invariable Feature Transformation (SIFT) specifics for every shoeprint image. Then, in combination of clustering dictionary learning, sparse coding (SC) and maximum pooling handling, a calculation was carried out on the sparse coding feature of shoeprint images. Finally, through a “word-image matrix” to be constructed, a reverse indexing (RI) table was set up for each visual word so that a new algorithm, named SC-RI, was set up for fast matching of shoeprint image. Experimental results from 16343 real shceprints` images showed that the SC-RI algorithm fulfilled a matching within about 121.26 milliseconds, being 140 times higher than that of the traditional SIFT-exhaustive matching choice, making the TOP 20’s accuracy reach up to 95.3% for local pattern matching in shoeprint image query.

Key words: shoe image matching; sparse coding; invert indexing; local feature extraction

文章图片

足迹作为犯罪现场中最常见的一种痕迹物证, 在案件串并及法庭举证等工作中一直具有重要作用。但是, 随着刑侦数字化与网络化技术的发展, 鞋底库中的图像数量越来越多。当从犯罪现场采集到鞋印图像时, 利用图像自动比对技术, 在大规模鞋印库中快速而准确地查询到其他相似鞋印, 为刑侦工作寻找破案线索, 在当前“ 科技强警” 工作中具有重要意义^[1]。

针对鞋印图像快速查询应用需求, 相关算法可分为三类：1）基于鞋印图像检索的方法, 该类方法的基本思想是提取鞋印图像的全局或局部底层视觉特征, 再结合机器学习或相似度量方法, 以实现鞋印图像相似查找, 例如文献[2]提出基于聚类的鞋印图像检索算法, 该算法针对鞋印图像类别之间存在隔离带这一情况, 设计一种K步稳定聚类算法以实现鞋印图像检索; 文献[3]融合局部二值模式（LBP）纹理特征与局部敏感哈希(LSH)索引方法, 提出一种大规模鞋印图像快速检索方法。2）基于鞋印图像分类的方法, 该类方法的基本思想是对鞋印图像实现自动分类, 以缩小排查范围而提高查找效率, 如文献[4]
提出一种基于卷积神经网络的鞋印分类算法, 该算法在将CNN模型引入鞋印图像分类的基础上, 针对网络中存在相似特征图的性质, 设计一种去冗余连接的CNN改进模型, 加快了网络收敛速度, 也提高了分类精度; 文献[5]提出一种基于语义的鞋印分类算法, 该算法在鞋印图像底层视觉特征的基础上, 还引入了语义信息, 有效地提高了分类性能。3）基于鞋印图像匹配的方法, 该类方法的基本思想是提取鞋印图像局部或关键点信息, 给定查询样图直接在鞋印库进行相似比对, 如文献[6]利用鞋印图像的尺度不变特征变换 (scale-invariant feature transform, SIFT)描述子, 提出一种基于RANSAC 算法的图像匹配方法; 除此之外, 还有基于能量谱密度（power spectral density, PSD）特征^[7]、Gabor纹理特征^[8]的鞋印匹配算法, 且在相应的测试集都具有一定的匹配精度。

在现勘鞋印图像比对实际应用中, 鞋印图像存在的特点有：1）鞋印花纹结构种类很多, 且同种花纹的鞋印样本很少; 2）犯罪现场很难提取与拍摄到清晰而完整的鞋印图像; 3）鞋印图像库中的图像总量很多。所以, 基于机器学习的鞋印图像检索与分类方法无法预先定义完备的鞋印花纹类别而提前训练出性能优异的分类器, 不具有通用性; 而基于匹配的鞋印查询方法, 没有考虑大数据集问题, 即当库中的图像数量非常多时, 若采用穷举比对的方法进行相似查找, 效率非常低, 不能满足实时性的应用需求。

针对上述问题及大规模鞋印图像快速比对应用需求, 本文提出一种基于稀疏编码（sparse coding, SC）^[9]与反向索引（reverted index, RI）^[10]的鞋印图像快速比对算法, 称之为SC-RI算法。该算法的主要思想是：首先, 提取鞋印图像的SIFT局部特征, 然后采用字典学习、稀疏编码与最大池化处理等方法, 计算出鞋印图像的稀疏编码特征; 最后, 通过构建“ 词-图像矩阵” 而设计反向索引结构。试验结果表明, 真实采集的鞋印图像虽然整体上来说不完整, 但只要存在局部清晰的花纹结构, 就可以应用SC-RI算法简单而有效地实现比对查询。

1 鞋印图像局部特征提取

为了提高后续算法的稳定性与可靠性, 鞋印图像在录入数据库时, 在做局部特征提取之前, 首先, 按图1所示方法对鞋印图像进行直方图均衡化视觉增强、中值滤波与OSTU二值分割等预处理; 然后, 基于二值分割之后的图像, 自动检测关键点并计算其SIFT描述子^{[6, 10]}, 用于表示鞋印图像的局部结构特征。

	Figure Option View Download New Window
	图1 鞋印图像预处理方法与效果示意图Fig.1 Effect of preprocessing on shoeprint image

设IMG表示任一鞋印图像, 对其采用SIFT方法检测到关键点数量为n个, 则IMG的局部特征集记为：

其中表示第j个关键点的SIFT描述子。

2 CS-RI鞋印比对算法

设T={IMG_i:i=1, 2, ..., N}表示鞋印图像库, 其中N表示鞋印图像的总数量, 对T中的每幅图像进行SIFT局部特征提取之后, 设由所有SIFT描述子组成的数据集为：

其中表示第i幅图像IMG_i对应的SIFT局部特征集, n_i表示其SIFT描述子的个数, 为中的第j个SIFT描述子。

2.1 传统SIFT匹配

设Q为待查询的鞋印样图, 首先, 提取其SIFT局部特征 , 其中：表示第j个SIFT描述子, n_q表示SIFT描述子的数量。为了在鞋印图像库T中查询到与之相似的其他图像, 传统方法就是计算F_Q与F_set中每一个SIFT描述子的相似性。具体方法是^{[6, 10]}：对于F_Q中的任意Y_j, 基于欧氏距离在中搜索它的最近特征点X_ij1与次近特征点X_ij2。然后, 计算Y_j与它们之间的欧氏距离 , 若D₁与D₂的比值D_{1 /} D₂小于某个阈值σ （后续实验中取σ =0.5）, 则认为X_ij1与Y_j是一对匹配点。反之则不是匹配点。通过上述方法, 设鞋印图像IMG_i与Q的SIFT描述子总共匹配的点数为M(IMG_i, Q), 则其相似度定义如下：

其中, 即可以通过式（3）计算Q与鞋印图像库T中所有幅鞋印图像之间的相似度, 再按相似度由大到小进行排序, 从而得到比对查询结果。

2.2 稀疏编码与反向索引

在鞋印比对实际应用中, 通常面对的是大规模鞋印图像库, 且每幅鞋印图像提取的SIFT描述子的数量也会达到上千个, 若直接采用第2.1节所述方法进行逐个穷举匹配, 则比对速度会非常慢。所以, 本文提出一种基于稀疏编码与反向索引的快速比对算法, 相关原理与步骤如下：

2.2.1 构造视觉字典

为了构造视觉字典, 本文将F_set中所有图像对应的SIFT描述子排在一起, 记作：

其中为SIFT描述子的总数。具有相同花纹结构的鞋印图像其局部区域对应的SIFT描述子在特征空间将会聚集在一起, 采用K-Means方法将Set中SIFT描述子聚成K类（后续实验中K=6000）, 每个聚类中心通常都代表一组具有相同视觉特征的图像区域, 称之为“ 视觉字” , 记作 ; 称这K个“ 视觉字” 为“ 视觉字典” , 记作：

其中D的每一列表示字典中的一个码元（视觉字）, K表示字典的长度。

2.2.2 计算稀疏编码特征

设为第i幅鞋印图像IMG_i对应的SIFT描述子数据集, 对于F_i中的每一个SIFT描述子 , 采用OMP方法求解式（6）优化问题^[9], 得到其稀疏编码系数：

其中λ > 0正则系数（后续试验中λ =0.15）, 表示系数a_j的L₁范数。然后, 将F_i中所有SIFT描述子的稀疏编码系数按列排在一起, 记为：

其中B_i中的每一列表示一个SIFT描述子的稀疏编码系数。最后, 对中的数据进行最大池化（max pooling）处理, 即在所有编码系数a_j的各个维度上取最大值, 也就相当于在B_i的每一行分别取大值, 从而得到的稀疏编码特征 , 记为：

其中：表示B_i中第k行的最大池化处理结果。

2.2.3 反向索引

反向索引也常被称为倒排索引^[10], 是一种起源于文档快速检索的索引方法, 本文将它用于鞋印图像比对, 其主要原理是：首先, 对于鞋印图像库中每一幅图像, 通过第2.2.2节所述方法, 计算它的稀疏编码特征（列向量）, 记为： , 其中 K示第j个码元（视觉单词）对应编码系数（注：因为是稀疏编码, 这些系数中大部分是0）; 然后, 将所有鞋印图像对应的稀疏编码特征排在一起, 则得到“ 词-图像矩阵” , 记为：

其中A_{k× N}每一行对应一个“ 视觉字” , 每一列对应一幅鞋印图像。也就是说：在A_{k× N}这个“ 词-图像矩阵” 中, 竖向每一列就是一个正排表, 若该列向量第k个维度上的数值非0, 则说明图像存在第k个视觉单词, 反之则不存在; 而横向每一行就是一个倒排表（反向表）, 若该行向量第i个维度上的数值非0, 则说明第i幅鞋印图像包含相应视觉单词, 反之则不包含。

在鞋印图像比对应用系统中, 建立反向索引其实就是计算“ 词-图像矩阵” A_{k× N}, 因为A_{k× N}中的每一行对应着一个视觉单词的反向索引表, 可以将中的数据以序列化的方式存储在一个文件里。在查找比对时, 先从相应文件加载A_{k× N}, 然后只要根据比对样图所包含的视觉单词信息, 就可快速找到所有包含相同视觉单词的其他图像, 以实现快速相似计算与比对。

2.3 相似比对与算法步骤

设Q为待查询的鞋印样图, 首先, 提取其SIFT局部特征 , 其中：Y_j表示第j个SIFT描述子, n_q表示SIFT描述子的数量; 然后, 采用第2.2.2节所述方法对F_Q进行稀疏编码与最大池化处理, 从而可得到它的稀疏编码特征。设表示Q与T中每幅鞋印图像的相似度, 为了利用反向索引快速计算 , 具体方法是：首先 , 在寻找非0系数（因为是稀疏编码, 中绝大部分系数是0）, 若则说明鞋印图像Q包含有第k个视觉单词, 则将视觉单词对应的反向索引表（即A_{k× N}的第k行）中的数据与相乘, 再累加到之中。

2.4 算法步骤总结

将本文提出的基于稀疏编码与反向索引的鞋印图像比对算法主要步骤总结如下：

算法：CS-RI鞋印图像快速比对算法

输入：鞋印图像集, K-Means字典构造聚类数量K, 比对样图Q;

输出：字典D, “ 词-图像矩阵” A_{k× N}, 相似度。

2.4.1 离线建立反向索引表

Step 1：SIFT局部特征提取

对 , 用第1节所述方法对其进行SIFT特征提取, 从而得到式（2）所示的特征数据集F_set;

Step 2：构造字典

利用特征数据集F_set, 采用2.2.1节所述方法进行K-Means聚成, 从而得到式（5）所示字典D;

Step 3：稀疏编码特征提取

对 , 首先, 在特征数据集F_set中找到其SIFT描述子集 ; 然后, 采用2.2.2节所述方法对F_i每个SIFT描述子X_ij进行稀疏编码, 并进行最大池化处理, 从而得到式（8）所示的稀疏编码特征b_i;

Step 4：建立反向索引表

将鞋印图像库T中所有图像对应的稀疏编码特征排在一起, 得到式（9）所示的“ 词-图像矩阵” A_{k× N}; 因为A_{k× N}中的每一行分别对应着一个“ 视觉字” 的“ 反向索引表” , 则将A_{k× N}存储起来, 以用于后续在线鞋印图像快速比对。

2.4.2 在线快速比对

对于比对样图Q, 采用上述相同方法, 提取其SIFT局部特征, 并计算其稀疏编码特征 ; 然后, 采用下述方法计算Q与T中所有鞋印图像的相似度：

Step 1：初始化

For (i=1; i< =N; i++) ; //N幅图像的相似度先初始化为0

Step 2：利用反向索引计算相似度

For (k=1; k< =K; k++)

//将第k个视觉单词对应的反向索引表（即A_{k× N}中的第k行）与相乘, 且累加到Sim中

End if

End For

Step 3：相似排序, 返回比对结果

对的N个数值由大到小进行排序, 并呈现对应鞋印图像, 返回比对结果。

3 实验结果与分析

为了验证本文所提CS-RI鞋印比对算法的有效性, 首先, 基于VS2010+OpenCV编程环境, 开发了一套鞋印图像管理与比对查询测试系统, 该系统分为三个子系统, 即：鞋印图像与信息入库子系统、鞋印图像库管理与维护子系统、鞋印图像比对子系统, 实现了鞋印图像信息入库、鞋印图像预处理、鞋印图像库管理与维护、索引结构建立、鞋印图像比对查询等功能; 然后, 收集了嫌疑人鞋印图像4256幅与真实采集的鞋印图像12 087幅, 建立一个包含16 343幅图像的鞋印数据库, 用于算法的仿真与测试, 同时也为了验证算法具有尺度与旋转不变性, 其中：4256幅嫌疑人鞋印图像大部分是通过一次镜像与旋转变化而得到的（即同一种图像存在3幅）, 而实采鞋印图像在拍摄过程中, 对每个足迹将会选择不同的角度与焦距, 拍摄3~10张图像。

在“ 以案查人” 应用实例中：首先, 打开从犯罪现场采集的鞋印图像, 如图2A所示; 然后, 对图像进行灰度化处理, 并在图像花纹结构较清晰的地方, 按住鼠标左键在图像中拖动, 剪取目标区域, 如图2B所示, 并且根据实际情况, 利用操作界面上提供的“ 旋转、视觉增强、负相变换、图像平滑与二值化处理” 等功能对剪取的图像块进行预处理, 如图2C所示; 最后, 点操作界面上的“ 快速比对” 按钮（对应本文的SC-RI算法）, 得到图3所示比对结果。

从图2所示操作过程可见, 虽然现勘中很难采集到完整而清晰的鞋印图像, 但只要其存在局部清晰的花纹区域, 本系统就可将其剪取下来, 并进行中值滤波与二值分割等预处理, 作为查询样图而实现鞋印比对查询。从图3所示的实现结果可见, 排在第1、2与7的图像, 都是“ 嫌犯鞋印库” 中与之相对应的正确比对结果。本次比对耗时119.64 ms, 电脑平台是：浪潮图像工作站, Win7操作系统（64位）, 8G RAM内存, Intel Xeon(R) 3.1G CPU处理器。

	Figure Option View Download New Window
	图2 鞋印图像比对操作流程（A：待比对的原始图像; B：剪切的目标图像; C：预处理之后的图像）Fig.2 Operational process of the shoeprint image comparison (A. original image for query; B. target image cut from the original; C. target image after preprocessing)

	Figure Option View Download New Window
	图3 鞋印图像比对查询结果Fig.3 Query results on comparing shoeprint images

在“ 以人查案” 应用实例中：首先, 打开嫌疑人鞋印图像, 如图4A所示; 然后, 采用上述相同方法在图像中剪切局部清晰的花纹区域并进行预处理, 如图4B所示; 最后, 点“ 比对识别” 按钮（对应传统SIFT匹配与逐个穷举比对方法）, 得到图4C所示比对结果。

	Figure Option View Download New Window
	图4 鞋印图像比对操作流程及比对结果（A：嫌犯鞋印原始图像; B：预处理后的目标区域; C：比对结果）Fig.4 Operational course of comparing shoeprint images and the result (A. original image of suspect; B. target image preprocessed; C. query result)

为了综合评估本文算法的比对速度与比对精度, 选取“ 折波型、交织型、线条型、边块型与圆点型” 等5种常见花纹结构, 每种10个, 共50个局部花纹结构作为比对样图, 进行综合评估实验, 其平均比对时间、Top10与Top20的正确率如表1所示。其中：平均比对时间是指50次比对的平均耗时, 平均Top10\或Top20正确率是指50次比对实验中, 比对结果前10幅或前20幅图像中比对正确的图像总数除以150, 这是因为：在鞋印库中大部分同类图像都存在3幅, 每次比对过程中都希望那3幅图像均能排在前10或前20之中, 即150（50× 3）为真正正确图像的总数。

由表1中试验结果可见, 本文利用鞋印图像的SIFT局部特征, 再结合稀疏编码与反向索引技术而提出的CS-RI鞋印比对算法, 其比对精度接近于传统SIFT匹配穷举比对方法, 只要鞋印图像存在局部清晰的花纹结构, 比对正确率均在90%以上, 但其比对速度提高了140多倍。这说明CS-RI是非常有效的鞋印比对算法, 其原因是：1）SIFT描述子是一种非常有效的图像局部特征提取方法, 其不但能捕获丰富的图像底层视觉特征, 而且还对图像旋转、尺度缩放、光照变化均具有不变性; 2）通过字典学习与稀疏编码, 能从鞋印图像中获取有意义的结构基元, 最后得到的编码系数, 能很好地描述鞋印图像中所包含的各种花纹信息, 近些年, 稀疏编码在图像语义分析问题已得到成功应用, 且性能卓越。

表1 比对精度与时间对比 Table 1 Comparison of both the matching accuracy and used time

4 小结

针对刑侦中大规模鞋印图像快速查询应用需求, 本文基于鞋印图像的SIFT局部特征, 再结合稀疏编码与反向索引技术, 提出了一种CS-RI鞋印图像快速比对算法, 且利用VS2010+OpenCV编程环境, 实现了所提算法而开发了一套鞋印比对测试系统, 其主要工作是将SIFT特征、稀疏编码与反向索引技术用于鞋印比对问题, 并进行了对比试验与分析。实验结果表明, CS-RI算法比对精度高且速度快, 是一种非常有效的鞋印比对算法。在后续工作中, 将在更大规模的残缺鞋印集中做进一步验证, 由于鞋印比对在刑侦中具有重要应用价值, 是一个值得进行深入研究的课题。

The authors have declared that no competing interests exist.

作者已声明无竞争性利益关系。

参考文献

文献选项

[1]	马杰, 刘晋, 班茂森. 平面扫描技术在尿渍鞋印提取中的应用研究[J] . 刑事技术, 2014, 39(5): 30-32. [本文引用:1]
[2]	王新年, 舒莹莹. K 步稳定的鞋印花纹图像自动聚类[J] . 中国图象图形学报, 2016, 21((5): 574-587. [本文引用:1]
[3]	李大湘, 吴倩, 李娜. 融合LBP特征与LSH索引的鞋印图像检索[J] . 警察技术, 2016, 156(3): 47-49. [本文引用:1]
[4]	张驰. 基于卷砍神经网络的鞋印图像分类算法研究[D]. 大连: 大连海事大学, 2016. [本文引用:1]
[5]	荆怡. 基于语义的鞋印图像分类算法研究[D]. 大连: 大连海事大学, 2017. [本文引用:1]
[6]	董艳丽, 崔艳. 基于 SIFT 和 RANSAC 的鞋印图像匹配算法[J] . 河南工程学院学报: 自然科学版, 2017, 29(1): 71-75. [本文引用:3]
[7]	DE CHAZAL P, FLYNN J, REILLY R B. Automated processing of shoeprint images based on the Fourier transform for use in forensic science[J] . IEEE Transactions on Pattern Analysis and Machine Intelligence, 2005, 27(3): 341-350. [本文引用:1]
[8]	LI X Y, WU M H, SHI Z P. The retrieval of shoeprint images based on the integral histogram of the gabor transform domain[C] //International Conference on Intelligent Information Processing, Berlin, Heidelberg: Springer, 2014: 249-258. [本文引用:1]
[9]	李宗民, 蒋迪, 刘玉杰, 等. 结合空间上下文的局部约束线性特征编码[J] . 计算机辅助设计与图形学学报, 2017, 29(2): 254-261. [本文引用:2]
[10]	戴周. 基于局部特征和视觉上下文的图像检索系统[D]. 成都: 电子科技大学, 2014. [本文引用:4]

2014

0.0

马杰, 刘晋, 班茂森. 平面扫描技术在尿渍鞋印提取中的应用研究[J] . 刑事技术, 2014, 39(5): 30-32.

... 工作中具有重要意义^[1] ...

2016

0.0

王新年, 舒莹莹. K 步稳定的鞋印花纹图像自动聚类[J] . 中国图象图形学报, 2016, 21((5): 574-587.

摘　要：目的鞋印是刑事侦查的重要物证之一，如何对积累的大量鞋印花纹图像进行自动归类管理是刑事技术迫切需要解决的问题之一。与其他类图像不同，鞋印花纹图像具有种类多但数目未知、同类花纹分布不均匀且同类花纹数目少的特点。基于鞋印花纹图像的这些特点，用目前典型的聚类算法对鞋印花纹图像集进行聚类，并不能取得很好的效果。在对鞋印花纹图像进行分析的基础上，提出一种K步稳定的鞋印花纹图像自动聚类算法。方法对已标记的鞋印花纹图像进行统计发现，各类鞋印花纹之间在特征空间上存在互不相交的区域（本文称为隔离带）。算法的核心思想是寻找各类鞋印花纹之间的隔离带，来将各类分开。过程为：以单调递增或递减的方式调整特征空间中判定两点为一类的阈值，得到数据集的多次划分；若在连续K次划分的过程中，某一类的成员不发生变化，则说明这K次调整是在隔离带中进行的，即聚出一类，并从数据集中删除已标记的数据；选择下一个阈值对剩余的数据集进行划分，输出K步不变的类；依此类推，直到剩余数据集为空，聚类完成。结果在两类公开测试数据集和实际鞋印花纹数据集上进行实验，本文算法的主要性能指标都超过典型算法，其中在包含5792枚实际鞋印花纹数据集上的聚类准确率和F—Measure值分别达到了99．68％和95．99％。结论针对鞋印花纹图像特点，提出了一种通过寻找各类之间的隔离带进行自动聚类的算法，并在实际应用中取得了很好的效果。且算法性能受参数的变化以及类的形状影响较小。本文算法同样适用于具有类似特点的其他数据集的自动聚类。

... 针对鞋印图像快速查询应用需求,相关算法可分为三类：1）基于鞋印图像检索的方法,该类方法的基本思想是提取鞋印图像的全局或局部底层视觉特征,再结合机器学习或相似度量方法,以实现鞋印图像相似查找,例如文献[2]提出基于聚类的鞋印图像检索算法,该算法针对鞋印图像类别之间存在隔离带这一情况,设计一种K步稳定聚类算法以实现鞋印图像检索 ...

2016

0.0

李大湘, 吴倩, 李娜. 融合LBP特征与LSH索引的鞋印图像检索[J] . 警察技术, 2016, 156(3): 47-49.

融合局部二值模式(LBP)纹理特征与局部敏感哈希(LSH)索引方法,给出一种大规模鞋印图像快速检索方法。首先,提取鞋印图像的旋转不变LBP特征,用于描述鞋印的底层视觉特征;然后,采用LSH方法为鞋印库中的图像建立索引结构,以实现快速检索。在包含有多种尺度与旋转变化的6万幅鞋印图像库中进行实验,TOP30检索正确率达到91.6%,且在检索速度方面,较之传统的线性搜索方法提高10倍。

... 文献[3]融合局部二值模式（LBP）纹理特征与局部敏感哈希(LSH)索引方法,提出一种大规模鞋印图像快速检索方法 ...

2016

0.0

张驰. 基于卷砍神经网络的鞋印图像分类算法研究[D]. 大连: 大连海事大学, 2016.

鞋印图像是刑事犯罪最常见的犯罪痕迹之一,它是揭露和证实犯罪的重要证据。目前鞋印分类和检索算法都采用人工挑选特征的方式,这需要大量的工程技术和专业领域知识,在一定程度上限制了分类、检索算法的研究。近几年来,在图像分类中取得很好效果的卷积神经网络(Convolutional Neural Networks, CNN)可以模仿人脑通过学习得到良好的特征,避免应用过多的专业知识,减轻研究人员的负担。基于此,本文提出基于卷积神经网络的鞋印图像分类算法,以期望通过学习的方式在无需人工提取特征的情况下提高鞋印分类的精度。由于在实际应用中,鞋印图像库具有种类多但部分类别样本数目少,且同类图像差异较大的特点,这就造成了直接应用CNN网络进行鞋印分类的精度低且不易收敛。因此,本文从训练数据和训练效率两个方面研究了CNN模型对鞋印图像的分类任务,提出了相关解决方案,提高了分类效率。本文主要工作内容如下：1)介绍了CNN的结构、思想框架及工作原理。介绍了在公开数据库上取得较好分类效果的CNN模型及其改进模型,分析了鞋印图像数据库与公开数据库的区别,给出了基于卷积神经网络模型的鞋印图像分类算法整体框架。2)分析了小样本集训练模型遇到的问题,从两方面给出了CNN小样本的训练方法。首先是样本扩充和每类样本数目选择的问题,其次是训练加速的方法。3)通过观察发现网络中存在相似的特征图,也就是说存在冗余的连接,针对这一问题优化网络,给出了去冗余连接的CNN改进模型,提高了网络的收敛速度,并且提高了分类的精度。将本文给出的CNN小样本训练方法和去冗余连接的CNN模型改进方法应用到鞋印图像分类,提高了分类精度。在实际鞋印图像数据集上的实验表明：本文方法与传统卷积神经网络和手工提取特征的方法比较,分类错误率上分别降低了6.57%、2.07%,分类精度达到了97.57%。

... 2）基于鞋印图像分类的方法,该类方法的基本思想是对鞋印图像实现自动分类,以缩小排查范围而提高查找效率,如文献[4]提出一种基于卷积神经网络的鞋印分类算法,该算法在将CNN模型引入鞋印图像分类的基础上,针对网络中存在相似特征图的性质,设计一种去冗余连接的CNN改进模型,加快了网络收敛速度,也提高了分类精度 ...

2017

0.0

荆怡. 基于语义的鞋印图像分类算法研究[D]. 大连: 大连海事大学, 2017.

鞋印作为犯罪现场中遗留率较高的痕迹之一,它在案件的串并分析和缩小嫌疑人范围的过程中起着至关重要的作用。鞋印图像分类是将鞋印图像按一定分类规则分到已知类别中的过程,鞋印图像的自动分类,能有效促进案件的侦破。其主要建立在图像理解的基础上,图像理解不仅需要底层的视觉特征还需要抽象的知识。因此语义信息能有效提高鞋印图像的分类性能,基于此本文给出了基于语义的鞋印图像分类算法,本文主要工作如下:1)给出了基于语义的鞋印图像分类算法框架本文针对目前鞋印图像分类算法存在的缺陷,给出了基于语义的鞋印图像分类算法框架。该框架主要包括:语义表达算法、空间关系描述算法以及结合最近邻的决策树分类算法三大部分。通过在鞋印数据集的相关实验来验证该框架的合理性。2)给出了兼顾语义相关性的语义表达算法本文以传统的视觉词袋模型为基础,结合鞋印图像的语义特性,给出了符合鞋印图像的基元语义词汇表构建方法;并根据监督反馈的思想获取了语义词汇表中各花纹单词的语义关系。最后根据各语义之间的关系实现了兼顾语义相关性的语义表达。经分类实验验证表明,这种兼顾语义相关性的语义特征比不考虑相关性的语义特征有更为有效的表达效果。3)给出了分层次的空间关系描述算法本文根据基元分布抗干扰能力的不同,将鞋印图像进行层次划分,并对不同层次的鞋印图像采用不同的空间关系描述方法。主要给出了基于距离度量矩阵的空间关系描述法和基于小波-傅里叶变换的空间关系描述法。经实验验证表明,这种分层次的空间表达算法,能有效的进行空间关系描述,为分类提供一定依据。4)给出了结合最近邻的决策树分类算法本文采用了决策树的树状流程结构对不同特征的最近邻分类结果进行可信度的判断,从而获取可信度较高的分类结果。该算法将两个分类方法进行了融合,即保留了各特征的分类优势,同时简化了分类器的训练过程,提高了分类准确率。经实验验证表明,本文算法具有较好的分类性能。为验证基于语义的鞋印图像分类算法的分类性能,本文将3500类7834幅嫌疑人鞋印图像数据作为测试数据库,从中随机选取1000类1000幅嫌疑人图像作为训练图像,1143类1143幅嫌疑人图像作为测试图像。经实验验证本文的分类准确性达到了 92.9%,且分类错误的类别仍具有较好的主客观一致性,是一种有效的分类算法。

... 文献[5]提出一种基于语义的鞋印分类算法,该算法在鞋印图像底层视觉特征的基础上,还引入了语义信息,有效地提高了分类性能 ...

2017

0.0

董艳丽, 崔艳. 基于 SIFT 和 RANSAC 的鞋印图像匹配算法[J] . 河南工程学院学报: 自然科学版, 2017, 29(1): 71-75.

摘　要：针对失真的鞋印图像的匹配问题,在研究中引入了基于尺度不变特征变换SIFT（scale-invariant feature transform）算法与RANSAC算法相结合的图像匹配方法.首先,对图像进行SIFT特征点的提取,在分析SIFT特征描述子生成的基础上,以最小欧式距离为标准来判断特征点是否匹配.然后,用最小欧式距离与次小欧氏距离之比进行初始匹配,用随机抽样一致性算法剔除SIFT算法匹配过程中存在的误匹配点对,从而实现精确匹配.实验结果表明,在局部鞋印图像中含有尺度缩放和旋转失真的情况下,该算法达到了良好的匹配精度且具有较强的鲁棒性和有效性.

... 3）基于鞋印图像匹配的方法,该类方法的基本思想是提取鞋印图像局部或关键点信息,给定查询样图直接在鞋印库进行相似比对,如文献[6]利用鞋印图像的尺度不变特征变换 (scale-invariant feature transform, SIFT)描述子,提出一种基于RANSAC 算法的图像匹配方法 ...

... 然后,基于二值分割之后的图像,自动检测关键点并计算其SIFT描述子^[6,10],用于表示鞋印图像的局部结构特征 ...

... 具体方法是^[6,10]：对于F_Q中的任意Y_j,基于欧氏距离在中搜索它的最近特征点X_ij1与次近特征点X_{ij2 ...}

2005

0.0

... 除此之外,还有基于能量谱密度（power spectral density,PSD）特征^[7]、Gabor纹理特征^[8]的鞋印匹配算法,且在相应的测试集都具有一定的匹配精度 ...

2014

0.0

... 除此之外,还有基于能量谱密度（power spectral density,PSD）特征^[7]、Gabor纹理特征^[8]的鞋印匹配算法,且在相应的测试集都具有一定的匹配精度 ...

2017

0.0

李宗民, 蒋迪, 刘玉杰, 等. 结合空间上下文的局部约束线性特征编码[J] . 计算机辅助设计与图形学学报, 2017, 29(2): 254-261.

... 针对上述问题及大规模鞋印图像快速比对应用需求,本文提出一种基于稀疏编码（sparse coding, SC）^[9]与反向索引（reverted index, RI）^[10]的鞋印图像快速比对算法,称之为SC-RI算法 ...

... 设为第i幅鞋印图像IMG_i对应的SIFT描述子数据集,对于F_i中的每一个SIFT描述子 ,采用OMP方法求解式（6）优化问题^[9],得到其稀疏编码系数： ...

2014

0.0

戴周. 基于局部特征和视觉上下文的图像检索系统[D]. 成都: 电子科技大学, 2014.

近几十年来,在图像信息方面,网络中用户每天上传的图像数量呈现出爆炸增长的趋势。如何有效的管理这些大量的图像数据,进而建立一个图像检索系统帮助人们快速找到自己感兴趣的图像便成了一个重要的研究问题。当前主流的图像检索系统采用局部特征和词袋模型取得了较好的检索性能,其检索系统的构建主要包括如下环节:图像局部特征的提取、视觉词典的构建、图像特征编码、相似度计算。然而,由于构建视觉词典存在的量化误差以及词袋模型对空间信息的忽略制约了检索系统的性能。本文介绍了一个基于局部特征并结合视觉上下文的图像检索系统,通过一系列的技术来进一步提高图像检索的精度和效率。本文首先介绍了基于局部特征和上下文的图像检索框架;通过为特征空间采用近似K-Means建立索引以及为图像编码建立倒排索引来提高整个检索系统的效率;比较了图像间不同匹配方法在速度和性能上的差异;接着分析比较了视觉上下文中的传统的和改进的弱几何一致性在图像检索中的差异;最后实现了一个基于传统方法和本文改进方法的一个图像检索系统。本文的主要贡献包括:1.设计并实现了一个基于局部特征和视觉上下文的图像检索系统,针对当前图像检索系统的不足,融合了汉明编码以及视觉上下文信息进行重排序提高检索的精度,并使用近似K-Means和倒排索引技术来提高检索的响应时间。2.比较了最近邻和近似K-Means方法在视觉词典上的查找差异,实验表明于近似K-Means方法在检索精度下降不到1%的情况下其速度上提高了100多倍,倒排索引技术成倍的提升了检索时间。3.分析比较了图像之间的几种匹配算法,包括蛮力匹配、基于视觉词典、汉明编码的匹配,实验表明蛮力匹配虽然性能较好,但是需要耗费大量的检索时间,而基于视觉词典的图像匹配采用了近似K-Means建立的索引以及汉明编码的结合能够很好的平衡精度和速度问题。4.分析比较了几种视觉上下文方法,包括弱几何一致WGC、加强的WGC、空间编码GC、强几何一致SGC、结合汉明码的WGC、及本文改进的M-WGC、M-EWGC、M-GC、M-HeWgc等。实验表明本文改进的方法都获得了检索精度的提高。

... 然后,基于二值分割之后的图像,自动检测关键点并计算其SIFT描述子^[6,10],用于表示鞋印图像的局部结构特征 ...

... 具体方法是^[6,10]：对于F_Q中的任意Y_j,基于欧氏距离在中搜索它的最近特征点X_ij1与次近特征点X_{ij2 ...}

... 反向索引也常被称为倒排索引^[10],是一种起源于文档快速检索的索引方法,本文将它用于鞋印图像比对,其主要原理是：首先,对于鞋印图像库中每一幅图像,通过第2 ...