视频侦查中多摄像头下嫌疑目标同一的概率研究
黎智辉1, 谢兰迟1,*, 吕游2, 王桂强1
1.公安部物证鉴定中心,现场物证溯源技术国家工程实验室,北京 100038
2.天津市公安局刑侦局,天津 300384
* 通信作者简介:谢兰迟,女,内蒙古通辽人,硕士,助理研究员,研究方向为影像技术。E-mail: xielanchi@139.com

第一作者简介:黎智辉,男,湖北石首人,博士,研究员,研究方向为影像技术。E-mail: lzhuil@sina.com

摘要

目的 视频侦查中的时空轨迹信息是很多案件侦破的关键,但在证据准备和法庭质证阶段,如何使用这些信息目前并没有方法依据。本文针对视频侦查中轨迹信息的证据转化问题,开展理论分析,建立概率方法。方法 结合视频侦查的典型过程,定义了摄像头下人物的人体、衣着和交通工具等特征;对不同的特征根据其出现的可能性进行针对性的概率估计以得到概率上限,对多摄像头下嫌疑人作案和逃窜过程的概率进行表示;基于图模型构造贝叶斯网络对轨迹追踪问题进行建模,并对模型利用贝叶斯网络特性进行求解,以得到似然比结果。结果 结合视频侦查场景给出了问题中似然比的公式和近似计算方法。1)通过分解提出时段、时序和方向假设建立了一种时空特征概率模型分析方法;2)提出了视频图像中衣服、人体、交通工具特征的概率分析思路框架;3)得到了假设条件下的似然比结果;4)给出了假设条件对概率计算的影响,讨论了实际应用中后验比估计的方法及方法的使用限制因素。结论 本文建立的理论分析方法首次为视频追踪结果的证据应用提供量化参考模型,从概率的角度解释了视频轨迹追踪结果为什么可以成为证据,有助于提升视频追踪证据的证明力: 基于视频中能观察到的常见的十二个特征(体态、上衣颜色、上衣纹理、上衣款式、裤子款式、裤子颜色、鞋子款式、鞋子颜色、头发长度、摩托车款式、摩托车颜色、摩托车行李箱样式)的条件,对于具有相同特征的目标依次出现在三个摄像头下(摄像头之间没有分叉路口)的案例,计算得到的似然比(第一个摄像头下的目标与第三个摄像头下的目标为同一目标和不同目标条件下,出现给定特征的可能性之比)下限超过108量级。

关键词: 视频侦查; 概率模型; 贝叶斯网络; 轨迹追踪
中图分类号:DF793.2 文献标志码:A 文章编号:1008-3650(2022)01-0024-11
Probabilistic Approach to Identifying Same Suspected Target from Multiple Cameras in Video Investigation
LI Zhihui1, XIE Lanchi1,*, LÜ You2, WANG Guiqiang1
1. Institute of Forensic Science, Ministry of Public Security & National Engineering Laboratory for Forensic Science, Beijing 100038, China
2. Division of Crime Investigation, Tianjin Municipal Public Security Bureau, Tianjin 300384, China
Abstract

Objective The spatial-temporal track information is key to find the suspected target in video investigation for many cases, yet lacking a methodic basis on how to use such information in the stage of evidence preparation and court testimony. Thus, a probabilistic approach was here to try for the problem to solve with evidence transformation of the target’s track information in video investigation.Methods The characteristic features were specified for human body, clothes and transportation vehicle (motorcycle in this essay) to go past the surveillance cameras under typical process of video investigation so that the different features were estimated of their presence probability plus its upper limit. Accordingly, the probabilities were to express the course of suspect’s committing crime and escaping under multiple cameras, therewith having converted the probability-based track query from a graph-representing model to one Bayesian network whose characteristics were hence able to utilize to have the likelihood ratio estimated.Results The formula and approximate calculation method were given about the likelihood ratio for the concerned problem put under video investigation scene, along with 1) a feature-based spatial-temporal probability model plus analysis being established through decomposition of the proposed time segment/range and direction hypothesis; 2) one probabilistic analysis plus thought framework being proposed about the characteristics of clothes, human body and vehicle in video image; 3) the probability ratio (i.e., likelihood ratio) results being obtained with hypothetical conditions; and 4) the influence being given of hypothesis on probability calculation, meanwhile both the method of posterior ratio estimation and its limiting factors being discussed for practical application. With the condition of twelve commonly-seen features (body shape, coat color/texture/style, pants style/color, shoe style/color, hair length, motorcycle style/color/luggage style) observed under three consecutive cameras (fixed onto a simply non-divergent road), the same target appearing sequentially past the three cameras (all the 12 features showing identical) delivers such a likelihood ratio that equals to at least 8 exponential magnitudes of 10 (i.e., 108) than the target not same.Conclusions A quantitative reference model is unprecedentedly provided with the here-established theoretical analytic method for evidential applicability of video tracking. Why probability-based video tracking results can be used as evidence is explanatorily defined, therefore helpful to improve the evidential power of video tracking.

Key words: video investigation; probabilistic model; Bayesian network; tracking

在视频侦查过程中, 对嫌疑人进行轨迹追踪是最直接、最有成效也最具视频侦查特色的工作。通过轨迹追踪, 常常能将嫌疑人在一定时空范围内的活动过程揭示并展现出来, 为理清嫌疑人的作案行为及过程、了解嫌疑人的逃窜方向甚至抓获嫌疑人提供关键的直接信息。因此, 在视频侦查工作中, 开展有效的轨迹追踪是视频侦查员必备的技能。一些有经验的视频侦查员能够根据视频中嫌疑人的细微特征, 随着监控摄像头一路追踪, 在一些特定条件下甚至能够直接通过视频信息追踪到嫌疑人住处。已有文献对时空轨迹的证据作用开展了讨论[1], 但是该文中并没有进行模型建立及理论分析。然而, 在另一方面, 当嫌疑人被抓获之后, 面对法庭质证时, 侦查人员常常面临视频追踪被嫌疑人否认的情况。因为很多时候, 视频侦查人员无法直接捕捉到嫌疑人的人脸图像, 而且即便是捕捉到了人脸图像, 也可能没有清晰到能够辨认出嫌疑人。当嫌疑人否认多个摄像头中出现的目标是自己, 而侦查人员又拿不出有力的证据或理由时, 轨迹追踪链条就可能断裂, 对于视频侦查证据的质疑就可能将轨迹最终结果从证据中排除。即便没有被排除, 证据的价值也会变低。

本文深入探究视频侦查活动轨迹背后的逻辑合理性, 尝试从贝叶斯框架的角度来理解并支撑活动轨迹的证据证明力, 对其证据价值开展基本的理论分析。

1 嫌疑人活动的概率模型
1.1 特征的定义

假设一个简单的模型:某一天, 嫌疑人在案发现场作案后骑摩托车逃窜, 侦查人员通过N个摄像头对嫌疑人进行全天的轨迹追踪, 在N个摄像头之下都发现了骑摩托车的男性嫌疑人的踪迹。在考虑证据的时候, 面对的问题可能是:如果在摄像头N下发现的目标为嫌疑人(如通过该摄像头可以看到其进入了某栋建筑, 警方在该建筑中找到了他), 第一个摄像头下的作案并逃窜的目标是否就是该嫌疑人(嫌疑人常常会辩解道:“ 第一个摄像头下的那个人并不是我, 可能是别人” )。

为简便起见假设嫌疑人的人脸图像无法区分, 在N个摄像头下, 能够分辨目标体态相同, 穿着相同颜色、纹理和样式的上衣, 同款同色的裤子和鞋子, 短发, 以及摩托车的相关特征等共十二个特征, 将其表示为FB(体态)、FC(上衣颜色)、FX(上衣纹理)、FP(上衣款式)、FT(裤子款式)、FTC(裤子颜色)、FS(鞋子款式)、FSC(鞋子颜色)、FH(头发长度)、FM(摩托车款式)、FMC(摩托车颜色)、FMB(摩托车行李箱样式)。在这些条件之外, 还有一些更确定的条件, 如N个摄像头的位置关系, 以及目标出现在摄像头下的时间(包括时间间隔)。当然, 这里没有考虑一些十分明确的特征如性别(而是直接默认针对男性进行分析), 通常在监控摄像头下判断性别并不困难。另外, 一些特征并不是很容易区分, 如上衣颜色在红外摄像头下就难以确定。但具体情况下的特征情况并不影响模型的理论分析, 只是会影响到模型中特征数量的问题。因此在下面的分析中不再考虑这些变量, 而是重点对模型进行分析。

1.2 轨迹追踪的概率

为便于讨论, 先进行特定情况下的分析, 再考虑一般情况。设N=3, 也就是有初始出现和最终出现的摄像头, 中间还有一个。在这种情况下, 一方面相对简单, 另一方面也能反映出其中的基本分析过程。如果分析只有一个或两个摄像头的情况, 一些关键的时空特征分析建模过程难以表现出来。假设Sn (在这里1≤ nN)是观察到的第n个摄像头下经过的一个人关联到的特征。其中S1表示在某个时间段T1第一个摄像头下出现一个目标人, 消失在往第二个摄像头方向, 并且具有体态、衣着以及所驾驶的摩托车车辆特征:F=(FB, FC, FX, FP, FT, FTC, FS, FSC, FH, FM, FMC, FMB); S2表示在某个时间段T2第二个摄像头下出现一个目标人, 从第一个摄像头方向过来, 消失在往第三个摄像头方向, 具有相同的体态、衣着特征F; S3表示在某个时间段T3第三个摄像头下出现一个嫌疑人, 从第二个摄像头方向过来, 具有相同的体态、衣着特征F。这里Sn包含三组特征, 一组是方向特征Dn, 一组是时间特征Tn, 另外一组是体态、衣着特征F, 即Sn=(Dn, Tn, F)。Dn的一般表示分为三种类型:如果n=1, Dn的意义为消失在往下一个摄像头的方向; 如果n=N, Dn的意义为从上一个摄像头的方向过来; 如果1< n< N, Dn的意义为从上一个摄像头方向过来, 消失在往下一个摄像头的方向。这三组特征Sn=(Dn, Tn, F)是判断摄像头下嫌疑目标轨迹的基础。在下面的讨论中, 先将Sn作为一个整体。

另外需要特别指出的是, 本文所有讨论都集中在案发的那一天时间段内, 这是一个背景条件。取一天作为讨论时间段的合理性体现在以下几个方面:首先, 在讨论时空轨迹时, 都会在一定的时空范围内, 时间是在案件中确定目标的重要限制条件; 其次, 监控视频能够记录事件发生的时间, 这为限制在特定时间段内进行分析提供了可能性, 也是相比其他证据类型的巨大优势; 再次, 一天作为计时单元是一个容易把握的概念。如果把从案件发生到抓获嫌疑目标的时间段作为计时单元也能够进行讨论, 但与一天的时间段并没有本质的区别, 除非有对一天不同时段案发特性的精确把握。

在上述假设基础上, 从概率的角度面对的问题是:如果观察到了上述假设条件(S1, S2, S3), 这N个摄像头下的嫌疑目标是不是同一个目标, 或者能够为这个问题提供什么样的信息。可以将这个问题转化成概率表达式, 即是求下式的值:

(1)

上式中分子意义为已知(S1, S2, S3)出现的条件下H出现的概率, 其中H代表第一个摄像头下出现的关注目标和第3个摄像头下出现的嫌疑目标是同一个目标。分母意义为已知(S1, S2, S3)出现的条件下$\bar{H}$出现的概率, 其中$\bar{H}$代表第一个摄像头下出现的关注目标和第3个摄像头下出现的嫌疑目标不是同一个目标。整个式子为观察到(S1, S2, S3)的条件下H和$\bar{H}$的概率比。式(1)无疑是一个困难的问题。本文的目标在于在贝叶斯框架下, 结合侦查实际分析该问题可能的解, 或其中可以得到哪些与H及$\bar{H}$有关的信息。

2 贝叶斯网络

式(1)包含了案件中遇到的多种情况, 可以看作一个一般性的模型。对于这种模型的求值过程, 可以根据贝叶斯网络理论进行。Dawid等[2]通过一个假设的例子分析了如何利用贝叶斯网络来帮助理解多种证据支撑下的证据价值的判断。贝叶斯网络的构造, 具有较强的理论背景。应用图模型构造贝叶斯网络解决具体的应用问题, 目前是一个研究热点, 其中涉及到法庭科学应用如DNA混合物分析, 分子系统生物学, 遗传、基因组和宏基因组等方面, 在2018年出版的《图模型手册》一书[3]中有较详细的论述。在影像证据方面的应用, 目前还未见有讨论报道。本文以下的分析过程, 参考了Dawid等[2]的贝叶斯网络应用思路。

2.1 本文的图模型和贝叶斯网络

式(1)的问题包含了多种因素, 可以用图1的模型来表示, 其中包括节点和节点之间的联系两种结构。节点包括两类, 其中方框代表观察到的因素, 圆圈代表待确定的未知因素。节点之间的联系由箭头表示, 箭头代表被指向的节点的概率依赖于箭头来源节点的概率。可以看到, 该模型关系较为简单。在观察到(S1, S2, S3)的概率后, 可以对H的概率更新。

图1 本文的图模型Fig.1 The graph-representing model for this article

根据贝叶斯公式, 式(1)可以表示为:

(2)

该式中右边的第一项称为似然比, 第二项称为先验比。在以下的讨论中主要关注似然比的计算, 因为这是作为证据提供的最重要的信息。对于先验比, 本文后面将做简短的讨论。将似然比利用贝叶斯公式进一步展开, 得到如下结果:

(3)

2.2 概率计算方法

下面分别分析该式右边三个乘积项的计算。

2.2.1 第一个乘积项

为两个概率之比。

分子项P(S1|H, S2, S3)的含义为:已知第一个摄像头中出现的关注目标和第三个摄像头中出现的嫌疑目标为同一目标, 且在第二个摄像头观察到一个特征为S2的目标、第三个摄像头观察到嫌疑目标特征为S3的条件下, 在第一个摄像头下观察到关注目标特征为S1的概率(即在第一个摄像头下出现的该关注目标体态、衣着特征为F, 出现时间段为T1并消失在往第二个摄像头方向的概率)。分母项P(S1|$\bar{H}$, S2, S3)的含义为:已知第一个摄像头出现的关注目标和第三个摄像头出现的嫌疑目标为不同目标, 且在第二个摄像头观察到一个特征为S2的目标、第三个摄像头观察到嫌疑目标特征为S3的条件下, 在第一个摄像头下观察到关注目标特征为S1的概率。根据前述给定条件有:

(4)

为了进一步简化计算, 假定在式(4)等式后的各特征之间都是相互独立。这一假定与实际情况较为符合, 如在摄像头下的行进方向与衣着之间、上衣颜色与裤子颜色之间、鞋子样式与头发长短之间等并没有直接的关联或依赖关系。当然, 在一些情况下也会出现习惯性的颜色搭配、样式搭配, 在此先暂不考虑。因此得到:

(5)

式(5)中有多个条件概率, 下面进行分析。先看关于方向的条件概率P(D1|H, S2, S3)。在已知(H, S2, S3)的条件下, 第一个摄像头下的目标人只有往第二个摄像头方向走, 因此P(D1|H, S2, S3)=1。在式(5)中, 最后12个条件概率都是这种类似情况, 其概率都为1, 只有P(T1|H, S2, S3)需要进一步分析。这个概率代表了已知H并且观察到(S2, S3)的条件下, 第一个摄像头下的目标人出现在时间段T1的概率。如假设目标出现在一天不同时间的概率密度函数为f(t), 则出现在某个时间段的概率为 , 其中tn是时间段开始的时间点, Δ Tn是持续的时长。当没有更进一步的统计信息支撑时, 将f(t)简化为 , 其中T0表示一天的时长。此时 。当观察到条件(H, S2, S3)时, 计算概率P(T1|H, S2, S3)。此时关注目标只能够出现在时间段T2之前, 在这个条件下概率密度函数 , 其中$\hat{T}_2$表示全天的从T2开始到结束的时间长度, 得到 。综合上面分析可以得到概率值如下:

对于P(S1|$\bar{H}$, S2, S3)的值进行估计更为复杂, 需要考虑到S1的各个特征, 下面详细分析。由于已知第一个摄像头下出现的关注目标与第三个摄像头下的嫌疑目标是不同目标, 且观察到S2S3, 在第一个摄像头下出现一个体态、衣着以及驾驶的摩托车车辆特征为F, 出现时间段为T1且消失在往第二个摄像头方向的人的概率主要考虑的是体态、衣着、车辆和时空特征。给定了$\bar{H}$以后, S1条件独立于(S2, S3)。因此:

(6)

另外, 给定了$\bar{H}$以后, 相当于将约束条件解除, 此时S1与$\bar{H}$独立。所以有下式成立:

(7)

为了进一步简化计算, 假定在式(7)右边的各特征之间都是相互独立, 则式(7)进一步变化为:

(8)

下面考察式(8)右边的各个概率项。

P(D1)代表了在第一个摄像头下出现的目标消失在第二个摄像头方向的概率, 在没有对摄像头位置更进一步了解的情况下, 假定这一概率为P(D1)=0.5是一个合理的选择, 也就是说消失在两个方向中的一个方向的概率为0.5。进一步讨论参见本文3.5。P(T1)代表了在第一个摄像头下的目标出现的时段间为T1的概率。根据前面分析, 。再来看关于体态和衣着特征的相关概率。尽管在摄像头下分辨方向是准确的, 但分辨体态、衣着特征具有一定的局限性, 如衣服的颜色难以精确描述, 不同的特征其概率可能非常不同。为了取得尽可能合理的结论, 我们在以下的分析中, 假设嫌疑目标体态、衣着特征都是大概率出现的特征, 也就是说嫌疑目标并不具有独特的、以极小概率出现的特征, 以取得式(8)的合理上限。如果在具体问题中遇到存在独特的特征, 其出现的概率会降低, 式(8)的值会减小。

P(FB)代表了在第一个摄像头下出现的任何人其体态为FB的概率。在此取P(FB)≤ 0.9, 详细讨论参见本文3.6。

P(FC)代表了在第一个摄像头下出现的任何人其上衣颜色为FC的概率。在此取P(FC)≤ 0.5。详细讨论参见本文3.7。

P(FX)代表了在第一个摄像头下出现的任何人其上衣纹理图案为FX的概率。为简化分析, 在此假定P(FX)≤ 0.5。详细讨论参见本文3.8。

P(FP)代表了在第一个摄像头下出现的任何人其上衣样式为FP的概率。在此取P(FP)≤ 0.5。详细讨论参见本文3.9。

P(FT)代表了在第一个摄像头下出现的任何人其裤子款式为FT的概率。在此取P(FT)≤ 0.5。详细讨论参见本文3.10。

P(FTC)代表了在第一个摄像头下出现的任何人其裤子颜色为FTC的概率。关于颜色的假定, 可以参考上衣颜色的分析, 取P(FTC)≤ 0.5。

P(FS)代表了在第一个摄像头下出现的任何人其鞋子款式为FS的概率。在此取P(FS)≤ 0.5。详细讨论参见本文3.11。

P(FSC)代表了在第一个摄像头下出现的任何人其鞋子颜色为FSC的概率。关于颜色的假定, 可以参考上衣颜色的分析, 取P(FSC)≤ 0.5。

P(FH)代表了在第一个摄像头下出现的任何人其头发特征为FH的概率。在此取P(FH)≤ 0.9。详细讨论参见本文3.15。

P(FM)代表了在第一个摄像头下出现关注目标驾驶的摩托车款式为FM的概率。在此取P(FM)≤ 0.075。详细讨论参见本文3.12。

P(FMC)代表了在第一个摄像头下出现关注目标摩托车颜色为FMC的概率。在此取P(FMC)≤ 0.5。详细讨论参见本文3.13。

P(FMB)代表了在第一个摄像头下出现关注目标摩托车行李箱款式为FMB的概率。在此取P(FMB)≤ 0.5。详细讨论参见本文3.14。

根据上述分析, 得到:

2.2.2 第二个乘积项

的意义与第一个乘积项意义类似。

分子项P(S2|H, S3)的含义为:已知第一个摄像头中出现的某个人和第三个摄像头出现的嫌疑目标为同一人, 且在第三个摄像头观察到S3的条件下, 在第二个摄像头下出现一个人体态、衣着特征为F, 出现时间段为T2并且消失在往第三个摄像头方向的概率。分母项的含义为:已知第一个摄像头出现的所有人和第三个摄像头出现的嫌疑目标为不同人, 且在第三个摄像头观察到S3的条件下, 在第二个摄像头下出现一个体态、衣着特征为F, 出现时间段为T2并消失在往第三个摄像头方向的人的概率。因此有 , 其中$\hat{T}_3$表示一天的从T3开始到这一天结束的时间长度。分母项P(S2|$\bar{H}$, S3)的分析与2.2.1中类似。由于给定了条件$\bar{H}$, 可以得到:

(9)

式(9)与式(8)的分析相同, 也有P(S2|$\bar{H}$, S3)≤

2.2.3 第三个乘积项

中, 分子项的含义为:已知第一个摄像头下出现的某个人和第三个摄像头出现的嫌疑目标为同一人的条件下, 在第三个摄像头下该嫌疑目标体态、衣着特征为F, 出现时间段为T3并来自于第二个摄像头方向的概率。分母项的含义为:已知第一个摄像头下出现的所有人和第三个摄像头出现的嫌疑目标为不同人, 在第三个摄像头下该嫌疑目标体态、衣着特征为F, 出现时间段为T3并来自于第二个摄像头方向的概率。仅考虑第三个摄像头下嫌疑目标的特征, 其本身与H及$\bar{H}$之间是独立的, 因此

2.2.4 总的似然比

根据2.2.1到2.2.3的结果, 总似然比为:

(10)

如果进一步简化, 由于 , 有

3 假设条件的影响

在前面的分析过程中, 为了简化计算引入了多个假设条件, 主要包括先验概率、独立性假设等, 下面对这些假设条件进行深入探讨。

3.1 基本假设

在本文前面的计算中考虑了最简单的摄像头分布情况, 也就是相邻的摄像头之间没有别的路, 即从第n个摄像头只能到第n-1个或第n+1个。这种情况是在视频追踪过程中最基本而且最可靠的环节, 因此也是本文关注的情况。当摄像头之间满足这种简单关系时, 目标人只有从起点到终点一条路, 当然如果目标人在摄像头之间徘徊, 并不影响分析, 因为总能够找到假设的情况。

如果改变这种假设, 如两个摄像头之间还有一条路, 如图2所示, 那么情况会变得较为复杂。

图2 分叉路口摄像头Fig.2 Surveillance cameras fixed at a road junction

这种假设条件下的网络模型并不会改变, 但会影响其他假设。方向假设就是受影响的例子之一, P(D1)的概率变得难以估计。目标假设也会受到影响, 需要考虑更多的因素。

3.2 独立性假设

该假设表明了目标特征(D1, T1, FB, FC, FX, FP, FT, FTC, FS, FSC, FH, FM, FMC, FMB)中的各项相互独立。所谓相互独立, 意味着一个变量发生的概率并不影响其他变量发生的概率, 如目标在摄像头下行进方向的概率与目标上衣颜色的概率并无关系, 而是独立发生的事件。这一假设无疑极大地简化了概率计算, 可能会产生的疑问是, 这些变量彼此果真是独立的吗?如果不是, 又会有什么影响。

在没有其他条件给定时, 目标出现的方向、时间、观察到的体态、驾驶的摩托车特征彼此之间以及与其他变量之间确实没有明确的关系。但如前所述, 一些人对于衣服颜色的搭配可能会有偏好。假设某人穿深色上衣时一定不会穿浅色裤子, 将这作为上衣和裤子颜色不独立的一个例子进行探讨。此时, P(FC, FTC)≠ P(FC)P(FTC), 下面看看不等号两边的量之间的关系。依然假设P(FC =深色) = 0.5, 根据 P(FC, FT)=P(FT|FC)P(FC), 上衣为深色时P(FTC =浅色|FC =深色)=0, 可知P(FC =深色, FTC =浅色)=0, P(FC =深色, FTC =深色)=0.5。如果出现了某种颜色搭配的情况, 可能是概率更小的更特别的特征, 也可能是概率更大的普遍特征。此外, 如果考虑颜色搭配偏好类型, 可能还需要考虑有偏好的人群的概率, 需要建立更复杂的模型。但对于整体分析来说, 并不影响模型本身, 只是影响部分概率的估计。

3.3 时段先验概率

对于该假设, 主要是计算方便。假设目标出现在一天不同时间的概率密度函数为f(t), 则出现在某个时间段的概率为 , 其中tn是时间段开始的时间点, Δ Tn是持续的时长。由于没有更多的统计数据来精确计算, 因此假设f(t)=1/T0, 即在一天的所有时间段其概率密度都相等。

3.4 时序假设

该假设采用了与时段假设相同的简化方式, 当已知条件(H, S2, S3)和(H, S3)时, 假定时间概率密度函数分别为 , 尽管在最终的估计时, 该假设及时段假设通过 进行了简略处理, 似乎没有起到应有的作用, 但在计算上为似然率的大小提供了约束。关于这些概率密度函数的进一步估计, 可以通过不同时段的统计来进一步获得。

3.5 方向先验概率

这一概率表示了在摄像头下目标人朝某个方向走的概率P(D1)=0.5。在3.1中的基本假设条件下, 该先验分布是合理的概率。如果3.1中的基本假设变化, 这个概率会改变, 如单行线, 或者两个摄像头之间有分叉路口等。

3.6 体型先验概率

对于一般情况下的监控视频来说, 如果画面不是特别清晰, 除非目标具有特殊的体态特征, 对于体态的判断很难特别精确。如图3所示, 穿深色上衣的目标人与其身后的人, 其体态在画面中区别并不明显, 其相似程度也不是很容易表述清楚。当我们表述“ 目标的体型为FB, 或出现体型为FB的概率” 时, 并没有一个量化的标准, 需要进一步的分析。为此我们将体型特征分类为两类, 肥胖和不肥胖。根据Lee等的研究[4], 中国男性肥胖率约10%。为了取得式(8)的上限, 假设嫌疑目标是不肥胖的体型, 得到P(FB)≤ 0.9的概率。对于实际情况来说, 在视频中确认肥胖体型或不肥胖体型比体态的其他常规特征更为容易, 也是最能够确定的情况。尽管P(FB)≤ 0.9是一个并不显眼的概率, 但是有较好的统计基础来支撑。

图3 摄像头下人物的体态特征Fig.3 Video from a surveillance camera showing the individuals’ physical characteristics

关于体型, 本文中采用了体型不是肥胖的概率P(FB)≤ 0.9。在实际情况下, 可能会出现特定的体型, 如走路特定的姿势, 受伤、残疾等, 这些概率会更小。如果这些体型特征在摄像头视频中能够分辨, 将会提供更好的区分度, 后验比也会更大。当然, 前提是对于这些体型特征概率分布有合理的统计数值。

3.7 颜色先验概率

在监控视频中, 颜色是大尺度特征, 不容易被忽略, 但是对颜色的描述较为困难, 尤其是在不同摄像头下同一颜色也会有一定的出入。为了简化问题, 可以将颜色分为深色、浅色两种来探讨。在未得到关于人群中对深色或浅色特别的偏好信息之前, 将其概率设为相等是一个看似合理的方案。因此对于目标的上衣颜色P(FC)≤ 0.5。

可以将摄像头下的可见颜色进一步区分, 将常见的上衣颜色进行概率统计, 具体某种颜色的概率会更小。实际上, 除了深色、浅色外, 混合色也是常见的一种。因此本文中所取的概率P(FC)≤ 0.5是一个合理的上限值。在考虑裤子和鞋子的颜色时也用了相似的假设。

3.8 纹理先验概率

在摄像头下, 上衣纹理图案的最基础分类可以是有纹理和没有纹理, 实际情况下是能观察到纹理或观察不到纹理, 假定其概率相等。因此该假设表示在上衣上观察到特定纹理图案的概率P(FX)≤ 0.5, 这一假设的统计数据支撑目前比较缺乏, 是一个一般性的估计, 与实际情况的出入可能较大。在一些季节如夏季, 关于T恤衫上有图案的概率可能更接近实际, 但是依然没有明确的统计支撑, 需要进一步的分析研究。

3.9 样式先验概率

在本文中, 对于上衣样式选取了上衣是否为套头衫的概率P(FP)≤ 0.5。如果对于样式有更明确的分类定义, 如衬衫、T恤衫、夹克、毛衣等, 并有相应的统计概率, 可以进一步提升区分度。在摄像头下, 上衣样式是可分辨的重要特征, 在进行目标比较时需要关注, 也需要进行更多的统计分析。

3.10 裤子款式先验概率

裤子的款式可以分为许多种, 在这里分为两大类即紧身和宽松, 并假定其概率相等, 取P(FT)≤ 0.5, 此外如果能够分辨裤子的长短、运动裤、牛仔裤等, 还能够进一步提升区分度。

3.11 鞋子款式先验概率

该假设对于鞋子的款式简单地分为是否为皮鞋, 取P(FS)≤ 0.5作为保守概率估计, 在条件好的情况下, 鞋子的形态、是否为高帮、鞋带等特征也能够使用, 其特异性会更强。

3.12 摩托车款式先验概率

根据网络报道[5], 2020年销售量最大的厂家摩托车销售量约为总量的12%。通过以下方式进一步考虑:该厂家两个品牌的百度搜索指数比(index.baidu.com)约为5:3, 代表了用户搜索次数的差别, 将其粗略地作为这两个品牌的分布概率。因此总的款式特征概率可以取0.075。在实际情况下, 摩托车品牌还能够分为多个不同的型号, 这些型号的区别在一些视频中可以较好的区分, 因此P(FM)≤ 0.075是十分保守的先验值。从这里可以发现, 对视频轨迹追踪过程而言, 摩托车是一个较为特异的特征, 一方面是因为摩托车容易分辨, 另一方面也容易分类。

3.13 摩托车颜色先验概率

有关摩托车的颜色, 相比衣服或鞋子的颜色特征, 同等距离下车辆表面形状及反光特性较好, 车辆颜色较衣服颜色更容易区分。实际可分辨的颜色种类会更多, 然而目前没有可靠的统计数据进行支撑。如果参照汽车的颜色, 根据涂料供应商Axalta发布的年度报告[6], 在中国, 白色系汽车约占57%(其中纯白46%, 珍珠白11%), 黑色22%, 灰色6%。取P(FMC)≤ 0.5是十分保守的估计值。需要说明的是, 参照汽车颜色的统计数据进行假定本身并不是十分严谨, 但给出一个假定的概率是必要的, 能够为理解这一特征给整个似然比带来的影响提供参考。

3.14 摩托车行李箱样式先验概率

摩托车行李箱属于加装配件, 是较为个性化的特征, 在没有确切的统计数据之前, 简单地以方形和非方形来分类。本文只是简单地从形状分类, 取P(FMB)≤ 0.5。如果有更精确的统计数据支撑, 对于观察到的摩托车行李箱样式也能得到更小的概率。

3.15 头发先验概率

在摄像头下能够分辨的头发特征包括长发和短发、头发颜色等, 为简化分析在本文中采用秃顶特征, 根据2014年来自日本的一份调查[7], 中国上海的男性秃顶率约为19%, 假定在视频中约一半的秃顶特征可见, 在此选择视频中观察到不秃顶的特定头发长短的概率P(FH)≤ 0.9。在实际情况下, 如果出现戴帽子的情况, 可能就难以使用, 但帽子本身就成了特征, 需要考虑戴帽子的概率。但对于摄像头下可见头发特征的进一步区分就比较困难。

3.16 目标先验概率

这个概率假定一个摄像头下的任意目标与另一个摄像头下的特定目标为同一人的概率 , 其中的前提是3.1的基本假设。在摄像头下出现的人越多, 这个先验概率越小, 只有一个人时, 肯定是同一人。这个先验概率符合3.1条件下的情况。

3.17 换衣先验概率

这个概率假定了在两个摄像头之间不更换衣服的概率P(Cn)=1。如果可能更换衣服, 即P(Cn)< 1, 情况会变得更复杂, 此时的图模型将需要改变为如图4所示, 后验比形式变为: , 计算会受到较大的影响, 需要更多的工作进行分析。

图4 考虑逃窜过程中换装的模型Fig.4 Graph-representing model for the suspect to change clothes in the process of escape

4 讨论
4.1 后验比的意义

在前面的讨论中, 给出了后验比 的定义。从该式的计算过程可以看到, 取比值能够简化一些计算, 如果不取比值, 直接计算分子(或分母)中的概率值, 受限于条件, 可能得不到有参考意义的结果。

式(2)中, 先验比 的分子项表示第一个摄像头下出现的关注目标与第三个摄像头下嫌疑目标为同一目标的概率, 分母项表示第一个摄像头下出现的关注目标与第三个摄像头下出现的嫌疑目标为不同目标的概率。

假定在第一个摄像头下一天内出现的所有人数为m, 得到 , 因此有:

下面对该后验比的值进行分析。首先直接从表达式来看, 由于似然比: , 因此后验比 , m代表了在第一个摄像头下时间段T1出现的所有人数, 如果m=1, 意味着在该时间段只有一个人, 那么该目标人是嫌疑人的后验比为无穷大, 也就是说二者肯定是同一人。如果人数增多, 依靠文中假设的这些简单的体态和衣着特征, 其似然率会变小。假设m=11, 后验比为2.8413× 107

式(2)给出了后验比、似然比和先验比之间的关系。本文模型中的似然比的意义为:已知第一个摄像头下的关注目标和第三个摄像头下的嫌疑目标为同一目标的条件下观察到(S1, S2, S3)的概率与已知第一个摄像头下的关注目标和第三个摄像头下的嫌疑目标不是同一目标的条件下观察到(S1, S2, S3)的概率之比。

比值 是没有观察到其他特征的情况下对于第一个摄像头下的关注目标和第三个摄像头下的嫌疑目标是否为同一目标的先验信息。

从上述关系可以看到, 后验比是在观察到特征(S1, S2, S3)后对于先验知识的进一步修正, 这一修正结果, 被用于解释观察到证据后对事实的新的认识。由于存在关系式P(H|S1, S2, S3)+P(H|S1, S2, S3)=1, 可以得到:

(11)

也就是说, 在观察到特征之后, 第一个摄像头下的目标人和第三个摄像头下的嫌疑人为同一人的概率(后验概率)为上述表达式(11)。对于该表达式, 表1列出了不同m的情况下概率数值。这些概率值, 在法庭上能够提供有益的参考。

当然, 如前面已经多次指出的, 表达式(11)以及表1中这些数值基于第三章中的假设, 而且随着观察到的特征的增加, 表1中的这些数值会有所变化。

表1 后验概率与通过人数间的关系 Table 1 The relationship between concerned people and posterior probability
4.2 多个摄像头情况

根据2 . 2节的分析有P(S1|$\bar{H}$, S2, S3)≤ 5.9326× 10-5 P(S2|$\bar{H}$, S3)≤ 成立。对于更一般的情况下, 如果有N个摄像头(N> 3), 满足基本假设条件, 而且这些摄像头之间的覆盖范围并没有重叠, 可以依据2.2.1及2.2.2中的分析类推得到关系式 , 其中1≤ kN-1。同样根据2.2.1及2.2.2中的分析可以得到概率值 , 其中1≤ kN-1。最终的似然比有下式成立:

可以看到摄像头越多, 似然比越大, 当摄像头增加到一定个数时, 已经能够确定是同一个目标了。

4.3 使用本文结论需要注意的问题

如前所述, 在三个摄像头下, 如果观察到适当的体态和衣着条件, 如果在一天的时间段人数小于1万, 后验概率可以达到大于0.999 96。这对于视频轨迹追踪来说无疑是可靠的数据支撑。然而, 在使用这一类数据结论时需要注意以下问题。

4.3.1 条件问题分析

根据本文的论述, 如果观察到目标符合第3章假设条件, 并不意味着就能够得到本文的结论。也就是说, 在三个摄像头之间无岔路口, 如果观察到目标都是正常身材、上衣浅色、上衣无图案、上衣样式是套头衫、深色裤子、深色鞋子、无秃顶, 并满足方向和时间条件, 并不意味着其似然比就能够达到 , 然而这是一个很容易混淆的结果, 对其深入地分析有助于准确地使用。

假设在第一个摄像头下出现两个人, 都满足上述条件。然而第一个目标(设为M1)穿着浅红色上衣, 深灰色裤子; 第二个目标(设为M2)穿着浅黄色上衣, 深蓝色裤子; 第三个摄像头下的嫌疑目标M3的体态衣着特征与M1相同。如果按照假设, 都是正常身材、上衣浅色、上衣无图案、上衣样式是套头衫、深色裤子、深色鞋子、无秃顶。

对于M1M3, 考虑观察到特征条件下似然比能够达到2.8413× 108。本文给出的例子模型是在三个摄像头下发现体态、衣着相同的目标, 这是观察到的证据。在视频轨迹追踪时, 分辨体态、衣着的区别是相对容易的事。在这里的体态相同, 并不指都不是肥胖的正常身材, 而是会参考身高、身体各部分比例甚至走路姿态等在内的多种视觉特征, 如果有不一致的地方, 可以区分开来; 对于衣着(上衣、裤子和鞋子甚至配饰)颜色、图案形状、样式及摩托车特征等更是如此, 头发也需要详细评估。总的来说这里所提到的相同, 指的是排除了任何无法解释的不一致情况。

然而对于M2M3来说, 只说明P(S1|$\bar{H}$, S2, S3)和P(S2|$\bar{H}$, S3)的计算可以按照第2章的方式计算, 并得到相同的结果。当计算P(S1|H, S2, S3)和P(S2|H, S3)时, 结果显然会变化。因为如果M2M3为同一人, 不换衣服, 且M3及第二个摄像头下出现的目标着浅红色上衣、深灰色裤子的条件下, M2穿浅黄色上衣、深蓝色裤子的概率肯定小于1。在计算P(S2|H, S3)时, 结果也会变化。

在第3章中的条件是为了估计条件概率P(S1|$\bar{H}$, S2, S3)以及P(S2|$\bar{H}$, S3)的上限而进行的假设。如果不采用这些假设, 而是直接统计视频追踪时所关注的特征的先验概率, 得到的概率估计P(S1|$\bar{H}$, S2, S3)以及P(S2|$\bar{H}$, S3)要更小。这在第3章中对一些假设的分析中已经讨论到, 这里再给出一个例子。假设在视频中能够分辨上衣的品牌标识, 这并不会影响P(S1|H, S2, S3)以及P(S2|H, S3)的概率, 但是却能够增加一个小的特征概率(如果有关于人们穿着衣服品牌的概率分布数据), 使得P(S1|$\bar{H}$, S2, S3)以及P(S2|$\bar{H}$, S3)更小。然而, 要在分析P(S1|$\bar{H}$, S2, S3)以及P(S2|$\bar{H}$, S3)时统计在概率上更显著性特征(概率更小), 在实际情况下十分困难, 所以本文才做了第3章中列出的假设, 以得到关于这些条件概率的一个上限估计, 从而得到后验比的下限。

在应用时, 最重要的条件是观察到的目标的特征相同。

4.3.2 应用限度

在视频轨迹追踪时, 对于特征相同的判定, 需要有一定的限度。如当视频中的目标越小(离镜头越远), 视频图像质量越差, 判定的准确性越低。关于这一方面的分析还是一个开放性问题, 目前并没有明确的答案。但是从经验来看在一些明显限度以内可以使用本文的结论, 下面来讨论这种限度。

一般来说, 影响对目标特征判断的因素主要包括目标离镜头的距离、光照条件, 除此以外噪声、模糊及变形等因素也在一定程度上产生影响。在这里主要关注距离和光照条件问题。

对于特定的摄像头而言, 目标离镜头的距离表现在影像画面上目标图像的大小。然而, 目标图像大小并不仅取决于距离, 还取决于成像器件的分辨率、摄像头的角度、镜头的焦距等因素。为简单起见只讨论目标图像大小本身, 以身高170 cm的目标为例(图5)。

图5 目标大小对特征的影响Fig.5 The effect of target’ s image size on features

图5左侧画面上目标图像的高度约为170像素, 每一像素代表1 cm(这里是平均数据, 并没有考虑角度造成的影响), 意味着尺度在1 cm以内的特征细节无法反映出来:如眼睛是否睁开、扣子的细节、衣服拉锁细节等。图5右边目标高度为85像素, 2 cm以内的特征细节无法反映, 更多的特征会消失。但对于衣服的样式, 戴帽子情况、头发长短(未遮盖部分)、体型、鞋子的形状、裤子形态(是否宽松)等特征都可以判断。因此, 画面目标高度80像素左右, 对于视频轨迹追踪来说, 已经有许多可以判别的特征了。

光照条件也是一个值得关注的问题。在图5所示的光照条件下, 目标的上衣颜色黄色部分辨识度较好, 但是上衣深色部分, 裤子颜色、鞋子颜色则需要仔细甄别甚至通过颜色测量进行辅助判断。该画面是室内环境, 如果室外环境白天的光照条件可能会更有利于颜色的判断。此外, 红外摄像头得到的图像, 其颜色特征很难在本例中使用。对于晚上的可见光图像, 其颜色特征使用也需要十分小心。总的来说, 在白天室外环境光照条件更有利于视频追踪的颜色特征判别。

此外, 对于本文讨论方法的一种可能的质疑如下:假设极端的情况, 一群满足本文假设条件的骑摩托车的人同时经过了第一个摄像头, 其中的一个实施了犯罪。那么本文的结果还有意义吗?从基于特征的似然比来说, 如果满足关于特征的假设, 本文的计算结果不会有任何变化, 且正好反映了特征判断的准确程度。只不过在这种情况下, 似然比并不会带来显著的信息更新。因为此时对于人群中的任何一个, 其先验比 值都非常大, 似然比已经不再有显著意义。

5 总结

本文讨论了监控录像中常见的轨迹追踪过程背后的证据理解, 首次从概率角度进行较为全面的分析并建立了一个基本的模型, 用于描述摄像头之间没有岔路口的情况下, 结合时空关系条件和观察到体态、衣着以及驾驶摩托车特征相同目标条件下, 第一个摄像头下的关注目标与最后一个摄像头下的嫌疑目标是否为同一目标的似然比, 并给出了具体的表达式和估计过程。在此基础上, 也对后验比进行了估计。当然, 这一估计表达式是基于一系列的假设条件, 本文也讨论了这些条件可能的影响以及缺陷。本文的分析, 可以为视频追踪结果的证据应用提供量化参考, 并为提交到法庭的视频追踪证据的证明力提供参考依据。此外, 笔者也希望引起对于视频证据的更多讨论。

参考文献
[1] 翟金良, 杨洪臣, 蔡能斌, . 时空轨迹信息在视频侦查办案中的应用[J]. 刑事技术, 2018, 43(5): 345-350.
(ZHAI Jinliang, YANG Hongchen, CAI Nengbin, et al. Spatio-temporal track information applying into video investigation[J]. Forensic Science and Technology, 2018, 43(5): 345-350. ) [本文引用:1]
[2] DAWID A P, EVETT I W. Using a graphical method to assist the evaluation of complicated patterns of evidence[J]. Journal of Forensic Sciences, 1997, 42(2): 226-231. [本文引用:2]
[3] MAATHUIS M H, DRTON M, LAURITZEN S L, et al. Hand book of Graphical Models [M]. CRC Press, 2018. [本文引用:1]
[4] LEE S, WEN W, XU W, et al. Prevalence of obesity and correlations with lifestyle and dietary factors in Chinese men[J]. Obesity, 2008, 16(6): 1440-1447. [本文引用:1]
[5] 2020年我国摩托车产销量数据[EB/OL]. [2021-02-05]. https: //www. sohu. com/a/446423039_608091.
(Our country’s 2020-year data of sold motorcycles[EB/OL]. [2021-02-05]. https://www.sohu.com/a/446423039_608091. ) [本文引用:1]
[6] Global automotive 2020 color popularity report[R/OL]. [2021-02-10]. https://www.axalta.com/content/dam/New%20Axalta%20Corporate%20Website/Documents/Brochures/axalta-2020-global-automotive-color-popularity-report.pdf. [本文引用:1]
[7] Ratio of men with thinning hair by city in the world (ratioof bald men)[EB/OL]. [2021-02-10]. https://nbakki.hatenablog.com/entry/2014/05/23/233500. [本文引用:1]