利用ImageXpress系统灰度特征区分激光打印复印一体机的打印及复印文件初探
梁政1, 韩星周1,2, 郝红光2
1.中国人民公安大学,北京 100038
2.公安部物证鉴定中心,北京 100038

作者简介:梁政(1989—),男,山东济南人,在读硕士研究生,主要从事文件检验技术学习和研究。Tel:18810599726; E-mail:lzheng-13@sohu.com

摘要

目的探索区分激光打印复印一体机的打印文件及复印文件的方法。方法利用ImageXpress系统对理光MP4000BSP激光打印复印一体机的打印文件和复印文件进行灰度特征值的测量。结果两种文件的灰度平均值的平均值和95%置信区间存有明显的差异,且这种差异较为稳定:打印件的平均值约为50,而复印件约为53;打印件的95%置信区间介于50和51.5之间,而复印件的置信区间介于52.5与54之间。结论本方法通过量化对激光打印复印一体机打印及复印文件进行区分是可行的。

关键词: 激光打印; 复印; 灰度值特征; 量化
中图分类号:DF794.2 文献标志码:A 文章编号:1008-3650(2013)04-0036-05
Distinguishing between laser-printed and copied documents by using imageXpress
LIANG Zheng, HAN Xing-zhou, HAO Hong-guang
Chinese People’s Public Security University, Beijing 100038, China
Abstract

Objective To explore a quantification method to distinguish printed documents and copied documents printed and copied with a same all-in-one laser printer.Methods The gray scales of documents printed and copied by RICH MP4000BSP all-in-one laser printer are measured by ImageXpress.Results The average and distribution range of gray scale of laser-printed documents are different significantly with that of copied documents.Conclusion It is possible to distinguish printed documents from copied documents printed and copied with a same all-in-one laser printer.

Keyword: laser printing; copy; gray scale; quantification

目前, 国内对激光打印复印一体机打印、复印文件的无损检验方法都是定性检验[1], 尚无量化的检验手段。本文利用ImageXpress(以下简称IX)系统对打印、复印文件进行区分检验研究。通过其对灰度特征的测量及数据统计分析, 探索区分激光打印复印一体机的打印文件及复印文件的方法。

1 材料与方法
1.1 材 料

实验材料为理光品牌的MP4000 BSP型号激光打印复印一体机, 在A4纸上打印写满汉字“ 一” 的文件3份, 编号为打印件1、2、3, 并用其复印3份编号为复印件1、2、3。

1.2 灰度值测量

灰度测量是根据用户设定的二值属性(Polarity)和区分亮暗像素的阈值(Threshold)对目标区域(ROI)内的亮像素或暗像素进行测量分析的过程。IX系统对灰度测量主要包括:直方图测量分析(Histogram analysis), 投影测量分析(Projection), 像素分析(Pixel analysis)等方面, 如图1(a)所示。

图1 灰度特征测量及灰度直方图

本实验主要研究直方图测量分析中的灰度平均值的测量与统计。一个图像的灰度直方图是用来描述其灰度级分布的图形。其中横坐标表示的是灰度级, 纵坐标表示的是该灰度级出现的频率。一个图像的灰度直方图一般为双峰图, 深色像素位于直方图的左侧, 并产生左侧峰; 而亮色像素位于直方图的右侧, 并产生右侧锋; 处于谷底的值可以用来作为确定图形边界的阈值[2], 如图1(b)。IX系统可以自动的对待测图像做出灰度直方图, 并对直方图中的相关数据进行统计分析后输出。

1.3 统计分析

测量后, 使用ORIGIN8.5.1软件对测量所得到的数据进行3次样条拟合, 并计算每张打印、复印文件上每一行、列的灰度平均值的平均值、及95%置信区间, 通过统计数据和拟合图形对打印、复印文件进行区分性探究。

2 结 果

对打印件1、2、3及复印件1, 2, 3分别进行不同行和不同列的测量。每一张文件上选择第1、2、7、8、13、14、20、21行, 第1、2、7、8、14、15列进行测量实验, 如图2所示。

图2 特征测量部位示意图

在测量过程中为了减少其它条件的改变对测量结果产生影响, 对如下参数进行固定:灰度直方图的阈值设定为130; 二值属性选择为黑色; 选择使用相同大小的目标区域, 这个目标区域可以包含一个完整的“ 一” 字; 扫描分辨率为800dpi。

对打印件1、2、3的相应行的字符进行测量, 得到测量数据见图3。对数据进行3次样条拟合, 得到图4。对打印件1、2、3的相应列的字符进行测量, 得到测量数据见图5。同样经3次样条拟合可得图6。对复印件1、2、3相应行的字符进行测量、统计, 并经3次样条拟合, 见图7图8。对复印件1、2、3相应列的字符进行测量统计, 并经3次样条拟合, 见图9图10

图3 打印件1、2、3不同行的灰度平均值

图4 打印件1、2、3不同行灰度平均值3次样条曲线拟合图

图5 打印件1、2、3不同列的灰度平均值

图6 打印件1、2、3不同列灰度平均值3次样条曲线拟合图

图7 复印件1、2、3不同行的灰度平均值

图8 复印1、2、3件不同行灰度平均值3次样条曲线拟合图

图9 复印件1、2、3不同列的灰度平均值

图10 复印件1、2、3不同列灰度平均值3次样条曲线拟合图

3 讨 论

从上述打印件、复印件每一行的3次样条拟合图可以看出:打印件上的8条3次样条拟合曲线, 形状上呈“ 中间低两头高” 的“ 微笑曲线” 的形式; 曲线左端点要略高于右端点; 相同列的平均灰度值之间的差别较小。

由行数据可见, 此台激光一体机的打印文件同一行上的平均灰度值不同, 有一定范围的差异。左、右两边的字符的灰度值较大; 中间部位的字符的灰度值略小; 同一行上左边的平均灰度值相对于右边字符的平均灰度值要高。

同样地从打印件及复印件每一列的3次样条拟合曲线图可以看出:曲线形状大致上呈“ 直线” 型; 其中第1、2列的测量值较高, 7、8、14、15列的测量值较低; 6条曲线不同列之间的竖直方向上的间隔较大(平均灰度最大相差10)。

为了对打印件和复印件进一步的区分, 对测量数据做如下统计(见表1~表4), 并对每一张打印件上的所有测量得到的数值进行统计(见表5):

表1 打印件各行平均灰度值的平均值及置信区间
表2 复印件各行平均灰度值的平均值及置信区间
表3 打印件各列平均灰度值的平均值及置信区间
表4 复印件各列的平均灰度值的平均值及置信区间
表5 打印复印件平均灰度值平均值和其置信区间

通过对3份打印件和3份复印件的不同行(见表1、2)和不同列(见表3、4)的数据统计可知:相同位置上的打印文件和复印文件在平均灰度值上存在一定的差异(其差值约为2.5), 且这种差异较为稳定; 打印件上的不同位置的灰度平均值及置信区间的变化趋势与复印文件上的变化趋势一致, 反映出来的本台激光打印复印一体机硒鼓的使用特征是一致的。

进一步对打印件和复印件上的所有文字的灰度平均值的数据统计(见表5)可知:复印件上行与列的字符平均灰度值分布情况与打印件一致。但是, 两种文件的灰度平均值的平均值和95%置信区间存有明显的差异, 且这种差异较为稳定:打印件的平均值约为50, 而复印件的约为53; 打印件的95%置信区间介于50和51.5之间, 而复印件的置信区间介于52.5与54之间。

分析比表明, 可以用IX系统对激光打印复印一体机进行打印复印文件的区分检验研究, 并有迹象表明可以据此区分打印和复印文件。本研究是基于在相近的时间、利用黑白二值打印复印一体机进行打印复印, 并对同一个汉字进行测量的条件下得到的。从数据统计结果来看, 打印和复印文件之间在平均灰度值上的确存有一定的差异, 在行、列的灰度值的曲线特征上也呈现有一定的规律性。至于在没有比对材料的条件下, 如何确定一份文件为打印或复印以及是否同台打印还需要进一步挖掘量化特征, 继续研究。

The authors have declared that no competing interests exist.

参考文献
[1] 刘小燕. 激光一体机的打印件与复印件的鉴别方法 [M]. 北京: 中国人民公安大学出版社, 2012: 510. [本文引用:1]
[2] Kenneth R. Castleman 著(朱志刚, 林学訚, 石定机, 等译). 数字图像处理 Digital Image Processing[M]. 北京: 电子工业出版社, 2004: 61-62. [本文引用:1]