第一作者简介:许士国,男,辽宁沈阳人,学士,正高级工程师,研究方向为刑事科学技术文件检验。E-mail: 1069004506@qq.com
目的 通过对打印文字栅格特征进行实验研究,总结其稳定性和易引起特征变化的因素,为二次添加打印和换页变造文件检验探索新的思路。方法 以500个常用汉字为主要研究对象,选用不同品牌、不同型号激光打印机,设置不同分辨率或质量模式,用同一台电脑或不同台电脑安装不同驱动程序,打印中易宋体常用字不同字号的样本。通过对打印文字笔画细节特征进行比对分析,总结打印文字栅格特征的规律特点。结果 打印文字存在三类栅格特征,一是横笔段厚度特征,二是竖笔段宽度特征,三是斜笔画阶梯特征。同一台打印机一次打印的文件,相同字体字号文字的栅格特征反映相同;不同打印机或同一台打印机连接不同版本操作系统的电脑,或安装不同驱动程序,或选择不同的打印分辨率,栅格特征可能发生变化。结论 栅格特征在同一次打印的文件中具有稳定性,在不同硬件和软件环境下可能发生改变,可以为换页文件和二次添加打印文件检验提供新的思路。
Objective It is difficult for forensic document examination to target second added printed and/or page-replaced documents from the model-identical and even same printer. The commonly-used printing devices (those types of needle, ink-jet or laser, all only able to process bitmap format files) cannot genuinely output the file of curving-glyph Chinese words. Alternatively, they adopt RIP (raster image processor) to handle the printed document, dividing every printed area further into certain numerous square zones (grid spaces) where to have the curving glyphs mapped so as to engender a printable bitmap format file. Here, grid features were to experimentally explore about their stability and change-caused factors with the printed documents, for purpose to provide a new reference regarding to identification of second added printed and/or page-replaced documents.Methods 500 frequently-used Chinese characters were taken as sample to print into their 9pt, 10.5pt, 12pt, 14pt, 15pt, 16pt and 18pt Simsun fonts with 26 laser printers of different brands or models at discrepant resolutions or quality modes. The laser printers were controlled under various print-driver programs from the same or different computers. With comparative analysis into the specifics of those printed words’ strokes, the involving grid features were to summarize their patterns and traits.Results There are 3 kinds of grid features: TFHS (Thickness Feature of Horizontal Strokes), WFVS (Width Feature of the Vertical Strokes) and LFOS (Ladder Feature of Oblique Strokes). The same-one printer delivered identical grid features when it printed one document to produce the words of same font and size from an undisturbed same-time printing. The grid features may change with the various printers, the computer-operation systems, the print-driver programs and/or the printing resolutions.Conclusions The grid features are stable within one document that is printed from a printer at one time, yet leaving a probability of changing once the printing configuration (hardware/software) has got any discrepancy.
鉴定利用同型号打印机特别是同台打印机进行二次添加打印或换页变造的文件, 是文件检验工作中的难题[1]。本文通过对打印文字栅格特征进行实验研究, 初步总结了其稳定性和引起特征变化的因素, 旨在为二次添加打印和换页变造文件检验探索新的思路。
TrueType Font, 简称TTF, 是曲线轮廓字库的一种, 它采用直线和二次B样条曲线描述字体的外形轮廓, 可以随意旋转、缩放、变形而不影响输出质量[2, 3]。针式、喷墨、激光等常见的打印机都是采用光栅方式的输出设备, 这些设备不能直接将字体的轮廓曲线输出到承印物上, 只能处理点阵位图格式的文件, 即根据分辨率设置, 将承印物表面分割成若干微小矩形栅格, 对应点阵位图像素是“ 1” 或“ 0” , 在每个栅格内填墨或不填墨。光栅图像处理器(raster image processor, RIP)是将文字、图形、图像等描述的页面转换成输出设备可以处理的点阵位图的专门设备, 有硬件RIP和软件RIP[4, 5], 办公用打印机通常采用软件RIP。
中易宋体是Windows操作系统的配置字体, 中文名称为宋体和新宋体, 英文名称为Simsun, 是最常见的TTF字体之一。下面, 以Lenovo LJ2200打印的300 dpi中易宋体五号“ 有” 字为例, 介绍TTF打印生成字符点阵位图的过程[6-7]。
1)从TTF文件提取“ 有” 字轮廓线(图1a)。
2)根据设备的分辨率和字体大小, 将字体轮廓映射到设备栅格空间(图1b)。
3)填充中心点在字体轮廓内(含轮廓线上)的栅格, 生成点阵位图(图1c)。
4)按点阵位图填墨, 打印成载体上的文字(图1d)。
根据已采集的打印文字图像分辨率, 绘制相应栅格图, 在栅格空间中分析打印文字笔画点阵特点。
1)利用Photoshop软件, 新建适当大小文件, 分辨率设置为7 200 dpi, 调整缩放比例为100%。
2)新建图层, 利用工具栏中的“ 单列选框工具” 在画布左侧选择一列, 设置前景色为绿色, 执行“ 编辑” │“ 描边” 功能, 宽度为1像素。
3) 依次向右移动24(7 200 dpi/300 dpi)像素并描边, 绘制出栅格图的竖线。
4) 新建图层, 利用工具栏中的“ 单行选框工具” 绘制出栅格图的横线。
按以上步骤, 完成了300 dpi栅格图的绘制。如果绘制600 dpi栅格图, 只需将选框移动距离调整为12像素即可。
用Photoshop软件的“ 图像” │“ 图像大小” 功能, 将三维建模鉴定系统采集的三号宋体300 dpi打印文字图像的分辨率调整为7 200 dpi, 复制粘贴到栅格图中进行测量。发现打印文字有如下三类栅格特征(图2):
1)横笔段厚度特征, 即水平笔段所占纵向栅格的多少。宋体字横笔平直, 横笔段较长, 该特征较明显。
2)竖笔段宽度特征, 即垂直笔段所占横向栅格的多少。宋体字一般有多个竖笔画宽度[8], 同一竖笔画, 因左右两边轮廓线多是曲线而非直线, 栅格处理后可能出现同一竖笔画的上下部分宽度不相等现象。
3)斜笔画阶梯特征。
选用惠普、兄弟、三星、富士施乐、联想、佳能、松下、理光、基士得耶等品牌的26台激光打印机, 安装不同打印驱动程序, 形成50组打印机与驱动程序组合。以常见500个汉字为主要研究对象, 设置不同分辨率或质量模式, 打印中易宋体常用字小五号(9磅)、五号(10.5磅)、小四号(12磅)、四号(14磅)、小三号(15磅)、三号(16磅)、小二号(18磅)等样本共1 000余份。利用三维建模鉴定系统获取单字高清图像, 通过比对分析, 总结打印文字栅格特征的规律特点。
同一次打印的文件, 同体同号字具有相同的栅格特征; 同一台打印机, 同一台电脑, 在未改变打印相关软件的情况下, 多次打印, 文字栅格特征相同。
不同品牌打印机、同一品牌不同型号打印机, 打印文字笔画可能表现出共同特点, 以下几种条件下的打印文字栅格特征共同特点比较集中。
1)在相同操作系统的电脑上安装相同驱动程序, 使用同一台打印机, 打印文字往往具有相同的栅格特征。如:将同一台Lenovo LJ2200打印机的打印驱动程序安装于4台64位Windows7操作系统电脑上, 打印文字栅格特征相同。图3是300 dpi打印宋体三号“ 青” 字栅格特征比对图。
![]() | 图3 安装于4台电脑的Lenovo LJ2200打印机300 dpi打印的“ 青” 字横笔段厚度特征和竖笔段宽度特征Fig.3 TFHS and WFVS of Chinese character “ 青” printed in 300dpi from a same Lenovo 2200 printer configured with 4 different computers |
2)相同品牌打印机, 安装同一类打印驱动程序, 打印文字往往具有相同的栅格特征。用同一台Windows10电脑, 连接5台惠普激光打印机, 自动安装打印驱动程序(表1), 打印文字具有相同的栅格特征。
![]() | 表1 5台惠普激光打印机及打印驱动程序 Table 1 Five HP laser printers and the relevant print-driver programs |
3)不同品牌打印机, 或相同品牌安装不同打印驱动程序的打印机, 打印文字也可能具有相同的栅格特征。如表2中的11台激光打印机, 在各自驱动程序和软件环境下, 打印文字具有相同的栅格特征, 占50组打印机与驱动程序组合的22%。
![]() | 表2 11台激光打印机及软件 Table 2 Eleven laser printers and different software |
不同品牌打印机、同一品牌不同型号打印机、同一打印机安装于不同操作系统的电脑, 栅格特征有可能不同, 栅格特征的差异与以下因素相关。
3.3.1 打印分辨率和质量模式
打印分辨率是每英寸墨点的数目(dot per inch), 用dpi表示。激光打印机打印分辨率通常有300、600、1 200 dpi, 分辨率越高, 笔画边缘越平滑。有的激光打印机用默认或标准模式, 有的是草稿/较好/最佳等模式, 默认、标准、较好模式, 通常是600 dpi。在不同的打印分辨率和质量模式下打印同一文档, 由于栅格大小不同, 栅格特征差异明显, 如图4是同一台打印机设置不同打印分辨率打印的宋体三号字“ 五” 。
![]() | 图4 不同分辩率打印的“ 五” 字横笔段厚度特征和斜笔画阶梯特征(a: 300dpi; b: 600dpi)Fig.4 TFHS and LFOS of the Chinese character “ 五” printed in different resolutions (a: 300dpi; b: 600dpi) |
有的打印机(如:Brother、Lenovo的部分机型)具有HQ1200(高质量1200)模式, 这是一种插值方式, 并非真正的1 200 dpi, 输出时需要将1 200 dpi栅格图形转换成600 dpi。值得注意的是, HQ1200打印模式下, 由于转换时的舍入处理, 相同文字的某个笔画, 可能出现两种栅格形状。图5是位于1 200 dpi栅格内的两个相同的形状(图5a), 转换到600 dpi栅格内, 由于相位的不同, 具有偶数个1 200 dpi栅格的形状, 可能形成上、下(或左、右)刚好填充整个栅格的情况, 也可能形成上、下(或左、右)各占半个栅格的情况(图5b)。占半个栅格的形状, 需要调整边缘到栅格线上(图5c), 从而形成两个不同的形状 (图5d)。
利用Lenovo LJ2200, 设置HQ1200模式打印的宋体三号字“ 田” , 部分横笔段有两种厚度, 部分竖笔段呈现两种宽度, 如图6。
![]() | 图6 Lenovo LJ2200打印机采用HQ1200模式打印“ 田” 字横笔段厚度特征和竖笔段宽度特征Fig.6 TFHS and WFVS of the Chinese character “ 田” printed in HQ1200 mode from Lenovo 2200 printer |
3.3.2 驱动程序和打印机语言
打印机驱动程序是操作系统和打印机之间的纽带, Windows操作系统下的打印机驱动程序管理应用程序的所有打印输出[9]。打印机语言是控制打印机工作的命令, 它告诉打印机如何处理接收到的打印数据。不同的打印驱动程序, 不同的打印语言, 打印文字往往具有不同的栅格特征。用同一台Brother MFC-7880DN打印机连接同一台电脑(Windows10x64), 分别安装不同的打印驱动程序(表3), 打印文字的栅格特征存在差异(图7)。
![]() | 表3 同一台打印机的不同打印驱动程序 Table 3 Three different print-driver programs for the same printer |
![]() | 图7 同一台打印机安装不同驱动程序打印“ 表” 字横笔段厚度特征和竖笔段宽度特征Fig.7 TFHS and WFVS of the Chinese character “ 表” printed under different print-driver programs with the same printer |
3.3.3 字体和字体版本
电脑操作系统中安装的Simsun3.x版本和Simsun5.x版本是两个字库, 一些文字形态、结构上存在差别[10]。Simsun5.03版本和Simsun5.1x版本在文字形态、结构上无明显差别, 但在个别文字的笔画形状上存在微小差异。如:在Simsun5.15、Simsun5.16中, “ 民” “ 武” “ 越” 字戈勾笔右下部有一个小疵点(图8a), 在Simsun 5.03版本中没有疵点(图8b)。
案例:2019年2月, 某经侦大队送检“ 股东决议” 1份共2页, 要求鉴定2页检材是否是一次打印形成的。检验发现:检材第2页只有“ 全体股东亲笔签字或加盖公章:” “ 北京× × × × × × 科技有限公司” “ 王× × (签字)” “ 年月日” 宋体小四号打印文字, 无正文内容。第1页为一整页文字, 大部分为宋体小四号文字, 重复出现的相同打印文字栅格特征反映一致。经用600 dpi栅格图进行测量, 检材第1页与第2页上的文字在横笔段厚度特征上存在明显差异。如:第1页上的“ 有限” 二字横笔段厚度一致, 均为2栅格(图9a); 而第2页上的“ 有” 字第2、3横笔段, “ 限” 字“ 阝” 旁横笔段和“ 艮” 旁第3横笔段较厚, 为3栅格, 其他横笔段为2栅格(图9b)。
![]() | 图9 “ 有限” 文字横笔段厚度特征(a: 第1页; b: 第2页)Fig.9 TFHS of two Chinese characters “ 有限” from (a: page 1; b: page 2) |
同一次打印文字栅格特征具有稳定性, 不同的打印驱动程序和打印机语言、不同的打印分辨率、不同的字体版本等因素可能造成栅格特征规律不同。同一次打印, 普通使用者一般无法对同一文档的不同文字, 按上述条件进行分别设置[11]。检材第1页与第2页文字栅格特征的差异, 反映出是不同机具, 或是同一机具、不同软件环境打印输出所致。因此, 出具了“ 检材第1页与第2页文字不是同一次打印形成” 的鉴定意见, 为案件侦办和诉讼提供了证据。
栅格特征是打印文字笔画的细微特征, 是字符点阵位图数字化特征的形象化反映。但在打印过程的显影、转印、定影环节中, 墨粉颗粒数量和到达纸面的位置会有误差, 不可能完全反映出点阵位图的原貌。在300 dpi打印文字中各类栅格特征明显, 在600 dpi以上打印文件中, 斜笔画阶梯特征不明显。检验中可优先选择横笔段厚度特征和竖笔段宽度特征, 并注意在重复出现的字中选取稳定的特征。
栅格特征在同一次打印的文件中具有稳定性, 在不同硬件和软件环境下可能发生改变, 可以为换页文件和二次添加打印文件检验提供新的思路。
[1] |
|
[2] |
|
[3] |
|
[4] |
|
[5] |
|
[6] |
|
[7] |
|
[8] |
|
[9] |
|
[10] |
|
[11] |
|