栅格特征在打印文件检验中的应用研究
许士国1, 王虹2, 姜峰1
1.辽宁省公安厅,沈阳 110032
2.中国刑事警察学院,文件检验鉴定公安部重点实验室,沈阳110035

第一作者简介:许士国,男,辽宁沈阳人,学士,正高级工程师,研究方向为刑事科学技术文件检验。E-mail: 1069004506@qq.com

摘要

目的 通过对打印文字栅格特征进行实验研究,总结其稳定性和易引起特征变化的因素,为二次添加打印和换页变造文件检验探索新的思路。方法 以500个常用汉字为主要研究对象,选用不同品牌、不同型号激光打印机,设置不同分辨率或质量模式,用同一台电脑或不同台电脑安装不同驱动程序,打印中易宋体常用字不同字号的样本。通过对打印文字笔画细节特征进行比对分析,总结打印文字栅格特征的规律特点。结果 打印文字存在三类栅格特征,一是横笔段厚度特征,二是竖笔段宽度特征,三是斜笔画阶梯特征。同一台打印机一次打印的文件,相同字体字号文字的栅格特征反映相同;不同打印机或同一台打印机连接不同版本操作系统的电脑,或安装不同驱动程序,或选择不同的打印分辨率,栅格特征可能发生变化。结论 栅格特征在同一次打印的文件中具有稳定性,在不同硬件和软件环境下可能发生改变,可以为换页文件和二次添加打印文件检验提供新的思路。

关键词: 文件检验; 二次添加打印; 打印机驱动程序; 栅格特征; 光栅图像处理器
中图分类号:DF794.2 文献标志码:A 文章编号:1008-3650(2022)01-0058-06
Applicability of Grid Features in Examination of Printed Documents
XU Shiguo1, WANG Hong2, JIANG Feng1
1. Liaoning Provincial Public Security Department, Shenyang 110032, China
2. Key Laboratory [Ministry of Public Security] for Document Inspection and Identification, Criminal Investigation Police University of China, Shenyang 110035, China
Abstract

Objective It is difficult for forensic document examination to target second added printed and/or page-replaced documents from the model-identical and even same printer. The commonly-used printing devices (those types of needle, ink-jet or laser, all only able to process bitmap format files) cannot genuinely output the file of curving-glyph Chinese words. Alternatively, they adopt RIP (raster image processor) to handle the printed document, dividing every printed area further into certain numerous square zones (grid spaces) where to have the curving glyphs mapped so as to engender a printable bitmap format file. Here, grid features were to experimentally explore about their stability and change-caused factors with the printed documents, for purpose to provide a new reference regarding to identification of second added printed and/or page-replaced documents.Methods 500 frequently-used Chinese characters were taken as sample to print into their 9pt, 10.5pt, 12pt, 14pt, 15pt, 16pt and 18pt Simsun fonts with 26 laser printers of different brands or models at discrepant resolutions or quality modes. The laser printers were controlled under various print-driver programs from the same or different computers. With comparative analysis into the specifics of those printed words’ strokes, the involving grid features were to summarize their patterns and traits.Results There are 3 kinds of grid features: TFHS (Thickness Feature of Horizontal Strokes), WFVS (Width Feature of the Vertical Strokes) and LFOS (Ladder Feature of Oblique Strokes). The same-one printer delivered identical grid features when it printed one document to produce the words of same font and size from an undisturbed same-time printing. The grid features may change with the various printers, the computer-operation systems, the print-driver programs and/or the printing resolutions.Conclusions The grid features are stable within one document that is printed from a printer at one time, yet leaving a probability of changing once the printing configuration (hardware/software) has got any discrepancy.

Key words: document examination; second added printing; print-driver program; grid feature; raster image processor (RIP)

鉴定利用同型号打印机特别是同台打印机进行二次添加打印或换页变造的文件, 是文件检验工作中的难题[1]。本文通过对打印文字栅格特征进行实验研究, 初步总结了其稳定性和引起特征变化的因素, 旨在为二次添加打印和换页变造文件检验探索新的思路。

1 光栅图像处理过程

TrueType Font, 简称TTF, 是曲线轮廓字库的一种, 它采用直线和二次B样条曲线描述字体的外形轮廓, 可以随意旋转、缩放、变形而不影响输出质量[2, 3]。针式、喷墨、激光等常见的打印机都是采用光栅方式的输出设备, 这些设备不能直接将字体的轮廓曲线输出到承印物上, 只能处理点阵位图格式的文件, 即根据分辨率设置, 将承印物表面分割成若干微小矩形栅格, 对应点阵位图像素是“ 1” 或“ 0” , 在每个栅格内填墨或不填墨。光栅图像处理器(raster image processor, RIP)是将文字、图形、图像等描述的页面转换成输出设备可以处理的点阵位图的专门设备, 有硬件RIP和软件RIP[4, 5], 办公用打印机通常采用软件RIP。

中易宋体是Windows操作系统的配置字体, 中文名称为宋体和新宋体, 英文名称为Simsun, 是最常见的TTF字体之一。下面, 以Lenovo LJ2200打印的300 dpi中易宋体五号“ 有” 字为例, 介绍TTF打印生成字符点阵位图的过程[6-7]

1)从TTF文件提取“ 有” 字轮廓线(图1a)。

图1 RIP工作过程示意(a:轮廓图; b:设备栅格空间; c:栅格图; d:激光打印文字)Fig.1 RIP operation process (a: outline glyph of the Chinese character “ 有” ; b: grid space of the device; c: bitmap of the Chinese character “ 有” ; d: the Chinese character “ 有” printed from Lenovo LJ2200 in 300dpi)

2)根据设备的分辨率和字体大小, 将字体轮廓映射到设备栅格空间(图1b)。

3)填充中心点在字体轮廓内(含轮廓线上)的栅格, 生成点阵位图(图1c)。

4)按点阵位图填墨, 打印成载体上的文字(图1d)。

2 打印文字栅格特征分析

根据已采集的打印文字图像分辨率, 绘制相应栅格图, 在栅格空间中分析打印文字笔画点阵特点。

2.1 栅格图的绘制方法

1)利用Photoshop软件, 新建适当大小文件, 分辨率设置为7 200 dpi, 调整缩放比例为100%。

2)新建图层, 利用工具栏中的“ 单列选框工具” 在画布左侧选择一列, 设置前景色为绿色, 执行“ 编辑” │“ 描边” 功能, 宽度为1像素。

3) 依次向右移动24(7 200 dpi/300 dpi)像素并描边, 绘制出栅格图的竖线。

4) 新建图层, 利用工具栏中的“ 单行选框工具” 绘制出栅格图的横线。

按以上步骤, 完成了300 dpi栅格图的绘制。如果绘制600 dpi栅格图, 只需将选框移动距离调整为12像素即可。

2.2 栅格特征的种类

用Photoshop软件的“ 图像” │“ 图像大小” 功能, 将三维建模鉴定系统采集的三号宋体300 dpi打印文字图像的分辨率调整为7 200 dpi, 复制粘贴到栅格图中进行测量。发现打印文字有如下三类栅格特征(图2):

图2 打印文字的3类栅格特征Fig.2 Three kinds of grid feature

1)横笔段厚度特征, 即水平笔段所占纵向栅格的多少。宋体字横笔平直, 横笔段较长, 该特征较明显。

2)竖笔段宽度特征, 即垂直笔段所占横向栅格的多少。宋体字一般有多个竖笔画宽度[8], 同一竖笔画, 因左右两边轮廓线多是曲线而非直线, 栅格处理后可能出现同一竖笔画的上下部分宽度不相等现象。

3)斜笔画阶梯特征。

3 打印文字栅格特征的规律特点

选用惠普、兄弟、三星、富士施乐、联想、佳能、松下、理光、基士得耶等品牌的26台激光打印机, 安装不同打印驱动程序, 形成50组打印机与驱动程序组合。以常见500个汉字为主要研究对象, 设置不同分辨率或质量模式, 打印中易宋体常用字小五号(9磅)、五号(10.5磅)、小四号(12磅)、四号(14磅)、小三号(15磅)、三号(16磅)、小二号(18磅)等样本共1 000余份。利用三维建模鉴定系统获取单字高清图像, 通过比对分析, 总结打印文字栅格特征的规律特点。

3.1 栅格特征具有稳定性

同一次打印的文件, 同体同号字具有相同的栅格特征; 同一台打印机, 同一台电脑, 在未改变打印相关软件的情况下, 多次打印, 文字栅格特征相同。

3.2 栅格特征具有共同性

不同品牌打印机、同一品牌不同型号打印机, 打印文字笔画可能表现出共同特点, 以下几种条件下的打印文字栅格特征共同特点比较集中。

1)在相同操作系统的电脑上安装相同驱动程序, 使用同一台打印机, 打印文字往往具有相同的栅格特征。如:将同一台Lenovo LJ2200打印机的打印驱动程序安装于4台64位Windows7操作系统电脑上, 打印文字栅格特征相同。图3是300 dpi打印宋体三号“ 青” 字栅格特征比对图。

图3 安装于4台电脑的Lenovo LJ2200打印机300 dpi打印的“ 青” 字横笔段厚度特征和竖笔段宽度特征Fig.3 TFHS and WFVS of Chinese character “ 青” printed in 300dpi from a same Lenovo 2200 printer configured with 4 different computers

2)相同品牌打印机, 安装同一类打印驱动程序, 打印文字往往具有相同的栅格特征。用同一台Windows10电脑, 连接5台惠普激光打印机, 自动安装打印驱动程序(表1), 打印文字具有相同的栅格特征。

表1 5台惠普激光打印机及打印驱动程序 Table 1 Five HP laser printers and the relevant print-driver programs

3)不同品牌打印机, 或相同品牌安装不同打印驱动程序的打印机, 打印文字也可能具有相同的栅格特征。如表2中的11台激光打印机, 在各自驱动程序和软件环境下, 打印文字具有相同的栅格特征, 占50组打印机与驱动程序组合的22%。

表2 11台激光打印机及软件 Table 2 Eleven laser printers and different software
3.3 栅格特征具有多样性

不同品牌打印机、同一品牌不同型号打印机、同一打印机安装于不同操作系统的电脑, 栅格特征有可能不同, 栅格特征的差异与以下因素相关。

3.3.1 打印分辨率和质量模式

打印分辨率是每英寸墨点的数目(dot per inch), 用dpi表示。激光打印机打印分辨率通常有300、600、1 200 dpi, 分辨率越高, 笔画边缘越平滑。有的激光打印机用默认或标准模式, 有的是草稿/较好/最佳等模式, 默认、标准、较好模式, 通常是600 dpi。在不同的打印分辨率和质量模式下打印同一文档, 由于栅格大小不同, 栅格特征差异明显, 如图4是同一台打印机设置不同打印分辨率打印的宋体三号字“ 五” 。

图4 不同分辩率打印的“ 五” 字横笔段厚度特征和斜笔画阶梯特征(a: 300dpi; b: 600dpi)Fig.4 TFHS and LFOS of the Chinese character “ 五” printed in different resolutions (a: 300dpi; b: 600dpi)

有的打印机(如:Brother、Lenovo的部分机型)具有HQ1200(高质量1200)模式, 这是一种插值方式, 并非真正的1 200 dpi, 输出时需要将1 200 dpi栅格图形转换成600 dpi。值得注意的是, HQ1200打印模式下, 由于转换时的舍入处理, 相同文字的某个笔画, 可能出现两种栅格形状。图5是位于1 200 dpi栅格内的两个相同的形状(图5a), 转换到600 dpi栅格内, 由于相位的不同, 具有偶数个1 200 dpi栅格的形状, 可能形成上、下(或左、右)刚好填充整个栅格的情况, 也可能形成上、下(或左、右)各占半个栅格的情况(图5b)。占半个栅格的形状, 需要调整边缘到栅格线上(图5c), 从而形成两个不同的形状 (图5d)。

图5 分辨率对栅格空间的影响(a: 1200dpi栅格空间两个相同的形状; b: 600dpi栅格空间; c: 栅格适配; d: 600dpi栅格空间两个不同的形状)Fig.5 Effect of resolution on grid spacing (a: two identical patterns in 1200dpi grid space; b: two identical patterns in 600dpi grid space; c: two identical patterns in grid fitting mode; d: two different patterns in 600dpi grid space)

利用Lenovo LJ2200, 设置HQ1200模式打印的宋体三号字“ 田” , 部分横笔段有两种厚度, 部分竖笔段呈现两种宽度, 如图6。

图6 Lenovo LJ2200打印机采用HQ1200模式打印“ 田” 字横笔段厚度特征和竖笔段宽度特征Fig.6 TFHS and WFVS of the Chinese character “ 田” printed in HQ1200 mode from Lenovo 2200 printer

3.3.2 驱动程序和打印机语言

打印机驱动程序是操作系统和打印机之间的纽带, Windows操作系统下的打印机驱动程序管理应用程序的所有打印输出[9]。打印机语言是控制打印机工作的命令, 它告诉打印机如何处理接收到的打印数据。不同的打印驱动程序, 不同的打印语言, 打印文字往往具有不同的栅格特征。用同一台Brother MFC-7880DN打印机连接同一台电脑(Windows10x64), 分别安装不同的打印驱动程序(表3), 打印文字的栅格特征存在差异(图7)。

表3 同一台打印机的不同打印驱动程序 Table 3 Three different print-driver programs for the same printer

图7 同一台打印机安装不同驱动程序打印“ 表” 字横笔段厚度特征和竖笔段宽度特征Fig.7 TFHS and WFVS of the Chinese character “ 表” printed under different print-driver programs with the same printer

3.3.3 字体和字体版本

电脑操作系统中安装的Simsun3.x版本和Simsun5.x版本是两个字库, 一些文字形态、结构上存在差别[10]。Simsun5.03版本和Simsun5.1x版本在文字形态、结构上无明显差别, 但在个别文字的笔画形状上存在微小差异。如:在Simsun5.15、Simsun5.16中, “ 民” “ 武” “ 越” 字戈勾笔右下部有一个小疵点(图8a), 在Simsun 5.03版本中没有疵点(图8b)。

图8 “ 民” 在电脑显示屏上的截图局部(a: Simsun 5.16; b: Simsun 5.03)Fig.8 Screenshots of one stroke from the Chinese character “ 民” (a: Simsun 5.16; b: Simsun 5.03)

4 打印文字栅格特征的应用

案例:2019年2月, 某经侦大队送检“ 股东决议” 1份共2页, 要求鉴定2页检材是否是一次打印形成的。检验发现:检材第2页只有“ 全体股东亲笔签字或加盖公章:” “ 北京× × × × × × 科技有限公司” “ 王× × (签字)” “ 年月日” 宋体小四号打印文字, 无正文内容。第1页为一整页文字, 大部分为宋体小四号文字, 重复出现的相同打印文字栅格特征反映一致。经用600 dpi栅格图进行测量, 检材第1页与第2页上的文字在横笔段厚度特征上存在明显差异。如:第1页上的“ 有限” 二字横笔段厚度一致, 均为2栅格(图9a); 而第2页上的“ 有” 字第2、3横笔段, “ 限” 字“ 阝” 旁横笔段和“ 艮” 旁第3横笔段较厚, 为3栅格, 其他横笔段为2栅格(图9b)。

图9 “ 有限” 文字横笔段厚度特征(a: 第1页; b: 第2页)Fig.9 TFHS of two Chinese characters “ 有限” from (a: page 1; b: page 2)

同一次打印文字栅格特征具有稳定性, 不同的打印驱动程序和打印机语言、不同的打印分辨率、不同的字体版本等因素可能造成栅格特征规律不同。同一次打印, 普通使用者一般无法对同一文档的不同文字, 按上述条件进行分别设置[11]。检材第1页与第2页文字栅格特征的差异, 反映出是不同机具, 或是同一机具、不同软件环境打印输出所致。因此, 出具了“ 检材第1页与第2页文字不是同一次打印形成” 的鉴定意见, 为案件侦办和诉讼提供了证据。

5 讨论

栅格特征是打印文字笔画的细微特征, 是字符点阵位图数字化特征的形象化反映。但在打印过程的显影、转印、定影环节中, 墨粉颗粒数量和到达纸面的位置会有误差, 不可能完全反映出点阵位图的原貌。在300 dpi打印文字中各类栅格特征明显, 在600 dpi以上打印文件中, 斜笔画阶梯特征不明显。检验中可优先选择横笔段厚度特征和竖笔段宽度特征, 并注意在重复出现的字中选取稳定的特征。

6 结论

栅格特征在同一次打印的文件中具有稳定性, 在不同硬件和软件环境下可能发生改变, 可以为换页文件和二次添加打印文件检验提供新的思路。

参考文献
[1] 韩星周, 韩元利, 秦达, . 二次添加打印文件检验现状[J]. 刑事技术, 2018, 43(6): 485-488.
(HAN Xingzhou, HAN Yuanli, QIN Da, et al. Status of examination on second added printing[J]. Forensic Science and Technology, 2018, 43(6): 485-488. ) [本文引用:1]
[2] 郑军. 集外汉字输入中TrueType字体技术和TrueType字库格式介绍[J]. 电脑知识与技术, 2009, 5(8): 1910.
(ZHENG Jun. The method for inputting outset Chinese cha-racters[J]. Computer Knowledge and Technology, 2009, 5(8): 1910. ) [本文引用:1]
[3] 舒忠梅, 胡金柱, 左亚尧. TRUETYPE字体中文字指令化技术剖析[J]. 微计算机信息, 1998(5): 54-56.
(SHU Zhongmei, HU Jinzhu, ZUO Yayao. TRUEYPE font instructing technique analyse[J]. Microcomputer Information, 1998(5): 54-56. ) [本文引用:1]
[4] 曾淑英. 数字印刷光栅图像处理系统研究[D]. 北京: 华北电力大学, 2010: 4-6.
(ZENG Shuying. Research on raster image processing system of digital printing[D]. Beijing: North China Electric Power University, 2010: 4-6. ) [本文引用:1]
[5] 陈阜东. RIP软件及应用技术(上)[J]. 影像视觉, 2007(1): 94-95.
(CHEN Fudong. RIP software and application technique(I)[J]. Techniques and Equipment, 2007(1): 94-95. ) [本文引用:1]
[6] 李琳琳. XPSDrv中TTF的Hinting研究与实现[D]. 成都: 电子科技大学, 2008: 11.
(LI Linlin. Research and implementation of Hinting for TTF in XPSDrv[D]. Chengdu: University of Electronic Science and Technology of China, 2008: 11. ) [本文引用:1]
[7] 杜德. 曲线轮廓汉字输出还原技术研究[D]. 济南: 山东大学, 2006: 31.
(DU De. The study on generating revivification technique for outline Chinese characters[D]. Jinan: Shand ong University, 2006: 31. ) [本文引用:1]
[8] 胡长原, 张福炎. 基于Type1格式的曲线轮廓汉字的Hinting技术[J]. 计算机辅助设计与图形学学报, 1996(3): 169-177.
(HU Changyuan, ZHANG Fuyan. A Hinting method for Chinese outline Font based on Type1 format[J]. Journal of Computer-Aided Design and Computer Graphics, 1996(3): 169-177. ) [本文引用:1]
[9] 何斌, 黄进, 陈其昌. Windows环境下打印机驱动程序的设计[J]. 电子计算机与外部设备, 2000(3): 19-21.
(HE Bin, HUANG Jin, CHEN Qichang. The design of printer driving program in Windows environment[J]. Computer and peripherals, 2000(3): 19-21. ) [本文引用:1]
[10] 韩元利, 韩星周. 常见6种宋体字库的特征及时间属性的调查比较研究[J]. 中国司法鉴定, 2020(4): 63-67.
(HAN Yuanli, HAN Xingzhou. Comparison and investigation research of features and date of six Chinese Song-fonts[J]. Chinese Journal of Forensic Science, 2020(4): 63-67. ) [本文引用:1]
[11] 许士国, 崔岚, 董章奥. 基于过程解析法的同机添加打印文件鉴别方法[J]. 刑事技术, 2021, 46(3): 228-233.
(XU Shiguo, CUI Lan, DONG Zhang’ao. Identification of added printing from same printer based on process analysis[J]. Forensic Science and Technology, 2021, 46(3): 228-233. ) [本文引用:1]