范文一:复杂场景中的自动人群密度估计
复杂场景中的自动人群密度估计
杨裕,朱秋煜,吴喜梅
(上海大学上海200072)
摘要:人群密度估计在场景监控中至关重要,它对人群安全以及现场管理调度有着重要的作用和+意义,但现有的人群 密度估计的方法均要求基于简单背景。提出一种基于纹理分析且适用于复杂场景的人群密度估计方法,使用自适应背景更 新及模板屏蔽的方法来克服复杂背景的影响,并使用基于灰度共生矩阵的纹理分析方法提取人群密度特征,进而利用支撑 向量机进行密度估计。对基于视频的人群图像实验表明,该方法较以前的方法更加准确有效。
关键词:人群密度估计;纹理分析;灰度共生矩阵;支撑向量机
中图分类号:TP391.4文献标识码:A 文章编号:1004—373X(2009)17—108一04
Automatic Estimation of Crowd Density in Complex SceI心
YANG Yu,ZHU Qiuyu,WU Ximei
(Sha“ghBi Unjversity。Shanghai,Z00072,China)
Abstract:Crowd density estimation,whjch means a lot to the crowd safety and timely management and scheduling,is an essentiaIissue in scene surveillance.As the existed method for crowd density estimation works only in a simple background scene,an improved method which can apply to complicated scene is proposed
in this paper.First background is updated by a— daptive background estimation,then employs mask and background subtracting to get the crowd foreground,the crowd features are extracted by employing grey Ievel dependence matrix,at last uses the support vector machine to identify
the level of the crowd density.The experimental results show that the method is efficient and feasible,which can appIy to complicated scene. Keywords:crowd density estimation;texture analysis;grey level dependence matrix;support vector machine
0引 言
随着社会的发展,越来越多的人口涌入城市工作生 活,人口密度大的城市中许多公共基础设施,如火车站、 地铁站、公交车站以及超市等经常会迎来短期的人流高 峰,一方面人群的高度拥挤容易造成灾祸,具有很大的 安全隐患;另一方面,在人流高峰期,若不能对人群进行 迅速有效疏散分流,也会对居民日常生活造成不便。针 对这一现状,近年来城市的许多公共场合都安装了监控 系统对人群进行监控。传统的人群监控系统都是通过 闭路电视对不同场景进行监视,由监控室的工作人员针 对监视场景中的情形进行人工判断。这种方法具有主 观性,不能定量分析,而且耗费人力,尤其当监控人员疲 惫的时候,容易忽视监视器上的突发状况,从而造成不 可挽回的后果uJ。随着现代数字图像和视频处理技术 的发展,自动、实时的智能化人群密度监控系统成为人 们的研究重点。
收藕日期:2008—12一08
基金项目:上海市科委重点攻关项目(07Dzl206)资助;上海市教委 重点学科项目(J50104)资助
、
108
传统的密度估计算法中,Davies和Chow[2’3]提出 了基于像素特征的图像处理方法来判断人群密度,该方 法主要通过背景减的方法来提取前景人群占据的空间 大小,以及运用边缘提取的方法检测人群对象的边缘长 度,通过这两类特征对人群密度进行估计。这种方法较 为简单,计算量小,当人群密度较低的时候效果较好,但 是当人群密度较高时,由于人群遮挡严重会导致结果误 差很大。1998年,Marana提出了一种基于纹理分析技 术的人群密度估计方法[4],该方法的依据是不同密度的 人群图像对应的纹理模式不同。高密度的人群在纹理 上表现为细模式,而低密度的人群图像在背景图像为低 频的同时在纹理上表现为粗模式。基于纹理分析的密 度估计方法可以解决高密度人群密度问题,但是算法计 算量较大,特征量较多,并且当背景较复杂时,对中低密 度人群估计的误差较大。此后如何结合使用不同纹理 分析方法来提高人群密度估计准确率成为了研究热点。 文献[5]提出一种基于小波变换和灰度共生矩阵的人群 密度估计方法;文献[6]提出了基于多尺度分析和分形 的人群密度估计方法。这些方法都提高了密度估计的 准确性,但都只适用于简单背景的情况。
万 方数据
本文针对复杂背景下,引入纹理分析的方法,使用 基于灰度共生矩阵的特征提取方法对人群密度进行分 类。算法框架如图1所示。
图1算法框图
输入的人群图像首先经过与背景图像相减,获得前 景人群图像,再进行模板屏蔽,屏蔽掉会干扰分类结果 的复杂背景区域,获得感兴趣区域j再对图像使用基于 灰度共生矩阵的纹理分析方法进行特征提取,最后将特 征样本送入支撑向量机获得分类结果。
1运动前景图像获取及特征提取
1.1运动前景图像获取
在使用差图像法获取运动前景的算法中,背景的构 造是关键的步骤。由于在实际应用中,其监控的场景中 可能有运动背景,例如地铁站内进出的地铁,公交站台 路边的过车等。大部分的研究人员都致力于研究不同 的背景模型[7’8],来减少动态场景变化对于运动分割的 影响。然而这些方法实现起来都比较复杂,不利于进行 实时人群密度估计的应用,因此本文中使用模板屏蔽的 方法将复杂的运动背景进行屏蔽,通过移除运动背景, 获得感兴趣的区域,使得人群信息更加清晰统一,简单 而有效地减少了复杂背景对人群密度估计结果的影响。 初始背景及模板的获取是根据监控场景的实际情况进 行人工选定,在监控过程中若监控摄像头容易发生偏移 则可采用背景更新的原理再对模板进行自适应调整。 在背景更新的方法中,本文采用基于视频帧差 CDM(Change Detection Mask)的方法[引。这一方法 的基本假设是在视频序列中,运动人体不会始终站在某 一位置不动,而必定会移动,使背景显露出来。该方法 应用各像素在时间轴上的统计信息,生成没有人群的参 考图像。人群视频空域上某一像素点的灰度值是沿时 间轴不断变化的一维随机信号。该信号的非平稳段意 味着有前景人群通过该像素点,而平稳段意味着该点表 示背景图像。通过计算平稳段灰度值的统计平均,可得 到背景图像在该像素点的灰度值。
假设图像序列的亮度分量为I。(z,y),其中z,y表 示像素位置,i表示帧数(i—l,2,…,N),N为序列总 帧数,用式(1)来表示视频帧差,它反映了相邻帧间的 亮度变化:
c。Mi cz,y,2{詈j 耋茎;, d=l I升l(z,y)一jf(z,y)l (1) 式中:阈值T用来控制去除噪声。对于位置(z,y), CDMi(z,y)表示在位置(z,了)处像素点沿时间轴的变 化曲线。可以根据CDMi(z,y)是否大于零,将这条曲线 分段,并将其中被检测到的静止部分用集合{Sj(z,y), 1≤歹≤M)表示,如图2所示。
图2(z,了)像素点沿时阃的变化曲线
式中:Sf的起点和终点分别是ST,和EN,。在位置(z, y)对应的{S,)的集合中,选择最长的静止分段并记录 该分段中点的对应帧号为M(z,y)。第M(z,j,)帧处的 点用来填充视频背景中的相应位置,用下式表示: M(z,y)一[ST(z,y)+EN(z,y)]/2(2) B(z,y)一J[z,y,M(z,了)](3) 式中:ST(z,y)和EN(z,y)是对应于最长静止分段的 起点和终点;B(z,y)为重建的视频背景。
在该实验监控场景中,如图3所示,其左角的自行 车属干扰区域,据此设计屏蔽左上角的模板对干扰区域 进行屏蔽。同时,为了减少复杂背景对估计结果的干 扰,将输入的人群图像与背景进行相减,从而获得前景 图像。如图4为背景图像,图5为对其进行模板屏蔽, 并进行背景减后的效果图。虽然屏蔽掉的区域会连带 部分经过人群的信息一起屏蔽掉,但是大部分人群的信 息都保留着,所以被舍去的那部分人群信息并不会对分 类结果造成太大影响。
图3人群图像 图4背景图像
图5模板屏蔽及背景减后效果图
1.2特征提取
20世纪70年代初,R.Haralick等人提出了一种叫
109
万 方数据
作空间灰度共生矩阵的统计方法‘10]。它是在假定图像 中各像素间的空间分布关系包含了图像纹理信息的前 提下,提出的一种具有广泛性的纹理分析方法。该方法 能够很好地反映图像的空间灰度分布情况。
灰度共生矩阵被定义为从灰度为i的像素点出发, 离开某个固定位置(相隔距离为d、方位为口)的点上灰 度值为歹的概率(或者频率),即p(i,歹I d,口)。所有估计 值形成了一个二维的直方图,也可以表示成一个矩阵的 形式,因此称为灰度共生矩阵。灰度共生矩阵反映了图 像灰度部分关于方向、局部邻域和变化幅度的综合信 息。对于纹理变化缓慢的图像,其灰度共生矩阵对角线 上的数值较大;而对于纹理变化较快的图像,其灰度共 生矩阵对角线上的值较小,对角线两侧的值较大。因为 一对(d,日)对应一个矩阵,因此将(d,口)控制在一定范 围内是非常必要的。通常,只取四个口(臼=o。;e一45。; 护一90。;口一135。)值和一个d值。同时,由于其数据量 大,一般不直接作为区分纹理的特征,而是基于它构建 一些统计量作为纹理分类特征。Haralick曾提出14种 基于灰度共生矩阵计算出来的统计量,即:能量、熵、对 比度、均匀性、相关性、方差、和平均、和方差、和熵、差平 均、差方差、差熵、相关信息测度以及最大相关系数。然 而,并不是特征量越多分类效果越好,这14种特征量各 有各的优点,通过选取不同的特征组合,经过多次测试, 本文选用了其中的四种统计量作为特征参数:
(1)能量(Energy)
~一l~一l
AsM一∑∑{户(i,歹l d,臼))2(4) £=O,士0
能量反映了图像灰度分布均匀程度和纹理粗细度。 若灰度共生矩阵的元素值相近,则能量值较小,表示纹 理细致;反之,若其中一些值大,而其它值小,则能量值 较大。当共生矩阵中元素集中分布时,ASM值大。 ASM值大表明一种较均一和规则变化的纹理模式。 (2)对比度(Contrast)
肛1N 1
con一∑∑(i一歹)2p(i,歹l d,口) (5) t=0,=O
对比度反映了图像纹理的清晰度和沟纹深浅的程 度。纹理沟纹越深,其对比度越大,视觉效果越清晰;反 之,对比度小,则沟纹浅,效果模糊。对比度大的像素对 越多,这个值越大,即灰度共生矩阵中远离对角线的元 素值越大,Con越大。
(3)逆差矩(Homogeneity)
Hom一篁莹辔咎等 ㈣ 120,30‘…J
逆差矩是与对比度相对应的物理量,反映了图像纹 理局部变化的大小。若图像纹理的不同区域间较均匀, 】10 变化缓慢,则逆差矩会较大,反之较小。
(4)熵(Entropy)
N一1p,一】
Ent一∑∑p(i,歹I d,口)109户(i,歹I d,口)(7) l=0,=0
熵是测量图像灰度级分布随机性的物理量,反映了 图像中纹理的非均匀程度或复杂程度。若共生矩阵中 所有元素有最大的随机性时,熵较大。
2密度分类及分类器选定
对人群图像进行了特征提取以后,需要对这些特征 进行分类。表l给出了1983年Polus关于服务级别的 一个定义[3],本文根据这个服务级别的定义将人群分为 低、中低、中高和高四类,见表2(实验中监控场景约为 10m2)。
对于同一种纹理特征提取方法,选用不同的分类器 得到的结果是不同的。所以选取适合的分类器也是很 重要的一环。由于本文所用的人群图像数量有限,因此 选择支撑向量机作为分类器。
裹l服务级别定叟
服务级别 人群密度(人/m2)
A自由人流
B受约束人流
Cl密集人流
C2很密集人流
D堵塞
≤O.6
O.6~0.75
O.75~1-25
1.25~2.0
≥2.0
表2密度与服务级别的关系
支持向量机能较好地解决小样本、非线性、高维数 和局部极小点等实际问题。支撑向量机的基本思想是:首先通过非线性变换将原始特征空间变换到一个高维 的空间,在这个新空间求取最优线性分类面,而这种非 线性变换是通过定义适当的内积函数实现的。它的判 别函数为:
J
厂(z)=sgnf≥:口ry。K(xi,x)+61(8) 、=i
式中:sgn(?)为符号函数;K(X,X7)为内积核函数。 输入特征向量为x=(z1,z2,…,一),共有s个支 撑向量x。,x:,…,X,,通过内积函数进行非线性变换, 再由决策层进行决策,最后生成分类结果。
由于支撑向量机一般只能实现两类模式的划分,本 实验采用3个支撑向量机进行分类。实验中,采用交叉 验证法确定三个分类器所用的内积核函数,即使用径向
万 方数据
基核函数(rbf),其结构及参数如图6所示。
径向基核参数:
K(X,X。)=exp(一70zi一毛|I 2), 7>O(9)
图6分类器结构
3实验结果及分析
本实验采用的人群图像是在上海大学食堂就餐高 峰期拍摄的人群视频经抽帧后得到的图像序列,总共 320幅,将这320幅图像分为低、中低、中高、高4类,每 类80幅图像,再将这80幅图像随机分为训练样本和测 试样本2组,每组各40幅。表3为本文所用方法进行 分类的结果。表4为仅基于灰度共生矩阵所作的结果 (其中d一1,汐=90。)。表5为使用文献[5]的方法对图 像使用小波变换后再对各频带使用灰度共生矩阵后的 结果(其中HL—Homogeneity,LH—Homogeneity, HH—Contrast,d一1,护一90。)。
表3本文方法实验分类结果
裹4对原图像使用灰度共生矩阵分类结果
衰5对原图像使用小波变换及灰度共生矩阵分类结果 小波变换在突显图像纹理变化的同时,也加深了复杂背 景的纹理信息,反而干扰了分类结果。本方法针对这一 情况使用了模板屏蔽,去除了不感兴趣且干扰分类结果 的高频复杂背景,更有效地使用了图像中的纹理信息; 同时对人群图像进行背景减,一方面提取出了前景的人 群信息,另一方面也降低了图像的灰度级别,在不提高 分类结果的同时降低了算法复杂度,使得对人群密度估 计的效率更高,满足了人群密度监控系统的实时性。
4结 语
本文对复杂背景下的人群进行自动估计,提出了一 种基于灰度共生矩阵进行有效分类的方法。针对训练 样本较少的特点,以支撑向量机构成分类器,提高了分 类的准确率。试验结果表明,提出的方法提高了使用灰 度共生矩阵对于复杂背景的分类准确率。
参考文献
[1]衣淑凤,黄祥林,沈兰荪.智能化人群监控技术研究[J].测 控技术,2003,22(5):22—24.
[2]Davies A c.Yin J H,VeIastin s A,以nz.Crowd Monito ring Using Image Processing[J].H!EE Elcctronics and Commu— nication Engineering Journal,1995,7(1):37—47.
[3]cho s Y,chow T w s,Leung c T.A Neural—based crowd Estjmation by Hyb“d GIobal Learning Algorithm[J].IEEE Trans.on Systems,Man,and Cybernetics—Part B:Cyberne— tics。1999,29(4):535—541.
[4]Marana A N,Velastin s A,costa L F,已£Ⅱf.Automatic Esti— matjo力o,Cfowd Den5i ty using Textufe[J].Safety Science, 1998,28(3):165—175.
[5]胡波。李晓华,沈兰荪.场景监控中的人群密度估计[J].电 路与系统学报,2007,12(6):19—22.
[6]王尔丹,李晓华,沈兰荪.基于多尺度分析和分形的人群密 度估计方法[J].计算机工程与应用,2005(29):35—38. [7]邓玉春.动态场景中的背景恢复[J].微电子学与计算机, 2004,21(11):70一72.
[8]zoran Zivkovic.Improved Adaptive Gaussian Mixture Model for Background Subtraction[A].Proceedings of the 17th ln— ternational Conference on Pattern Recognition[C].2004,2: 28~31.
[9]唐勇,姜昱明.一种基于彩色图像的运动人体分割方法[J]. 微电子学与计算机,2006,23(3):70一72.
从表中可以看出,对比本方法与文献[4,5]的方法, [10]M。,。na
A N,v。l。。tin s A,costa L F,。£。z.E。tim。ti。n of 在分类上,本方法有较大提高,尤其是对于中低和中高 c,。wd D。n。ity u。ing I。。g。Proc。。。ing[A].IEEE collo一 图像的分类效果有所提高。文献[5]的小波变换加共生 qujum on Image Processing for security Applications 矩阵法在复杂背景情况下效果反而不好,这主要是因为 [c].1997.
作者简介杨 裕女,1986年出生,广东人,硕士。主要研究方向为图像处理与模式识别。
朱秋煜 男?1963年出生。上海人,副教授.博士。主要从事图像处理与模式识别、计算机应用的研究。
吴喜梅女,1981年出生,山东人,硕士。主要研究方向为图像处理与模式识别。
111 万 方数据
复杂场景中的自动人群密度估计
作者:杨裕 , 朱秋煜 , 吴喜梅 , YANG Yu, ZHU Qiuyu, WU Ximei
作者单位:上海大学,上海,200072
刊名:
现代电子技术
英文刊名:MODERN ELECTRONICS TECHNIQUE
年,卷(期):2009,32(17)
被引用次数:1次
参考文献(10条)
1. 衣淑凤 . 黄祥林 . 沈兰荪 智能化人群监控技术研究 [期刊论文]-测控技术 2003(05)
2. Davies A C. Yin J H. Velastin S ACrowd Monitoring Using Image Processing 1995(01)
3. Cho S Y. Chow T W S. Leung C TA Neural-based Crowd Estimation by Hybrid Global Learning Algorithm 1999(04)
4. Marana A N. Velastin S A. Costa L FAutomatic Estimation of Crowd Density Using Texture 1998(03)
5. 胡波 . 李晓华 . 沈兰荪 场景监控中的人群密度估计 [期刊论文]-电路与系统学报 2007(06)
6. 王尔丹 . 李晓华 . 沈兰荪 基于多尺度分析和分形的人群密度估计方法 [期刊论文]-计算机工程与应用 2005(29)
7. 邓玉春 动态场景中的背景恢复 [期刊论文]-微电子学与计算机 2004(11)
8. Zoran ZivkovicImproved Adaptive Gaussian Mixture Model for Background Subtraction 2004
9. 唐勇 . 姜昱明 一种基于彩色图像的运动人体分割方法 [期刊论文]-微电子学与计算机 2006(03)
10. Marana A N. Velastin S A. Costa L FEstimation of Crowd Density Using Image Processing 1997
相似文献(8条)
1.期刊论文 王尔丹 . Wang Erdan人群运动与密度估计技术研究 -安全 2005,26(3)
人群的密度和运动估计对于人群安全和建筑物设计至关重要.本文研究了基于图像和视频处理的智能化人群自动估计方法.在人群密度估计上,对于低 密度人群图像采用基于像素统计的方法,对于较高密度人群图像采用基于多尺度分析和分形的纹理分析方法,并应用支撑向量机进行人群密度等级分类.在 人群运动估计上,使用块匹配法对人群运动速度进行估计.对人群图像和视频的实验表明,本文的方法较以前的方法更为准确有效.
2.期刊论文 刘小锐 . 周激流 . 李晓华 . LIU Xiao-rui. ZHOU Ji-liu. LI Xiao-hua频域基于灰度共生矩阵的人群密度 估计 -微计算机信息 2008,24(34)
人群密度估计对于大型公共设施的设计和人群的安全十分重要.本文提出了一种基于二维快速傅立叶变换和灰度共生矩阵的人群密度特征提取方法 .主要思想是依据不同密度的人群图像在其频谱图上的不同,将频谱图视为纹理图像,利用纹理分析的方法提取能够表现这些不同的纹理特征.进而利用 Adaboost实现人群密度级别的分类.实验结果表明本文提出的方法在具有不逊于其他算法的准确率的情况下,计算速度明显提高.
3.学位论文 杨裕 基于视频的人群密度估计研究 2009
随着经济社会的发展,尤其是我国城镇化进程的推进,城市人口密度越来越大,城市公共交通、生活设施等经常会迎来短期的人流高峰,人群的高 度拥挤若不能得到及时有效疏散容易造成灾祸。因此,基于视频系统的智能化人群监控技术也随之受到越来越多的关注和研究。
本文研究了基于视频和图象处理的智能化人群密度估计的方法。首先介绍了人群密度检测的国内外发展现状及其基本理论。通过分析可知,基于像 素统计的密度估计方法较为简单,但是当人群密度较高、人群遮挡严重时误差较大;使用纹理分析的方法可以充分利用图像的纹理信息,但是算法复杂 度较高。
针对以上问题,本文提出在不同密度人群情况下采用不同的密度估计算法的解决方法。每幅图像首先通过计算前景人群象素面积将图像初步分为低 密度和中高密度两类,然后对低密度人群使用基于象素统计的方法估计人数;对中高密度人群使用基于纹理分析的方法进一步估计密度。
对于低密度人群,本文提取人群前景像素面积以及边缘面积这两种特征,然后利用最小二乘线性拟合方法估计出这两类特征与人数的线性关系。在 获取人群前景面积方面,本文主要采用背景差分法以及自适应阈值二值化法获取前景人群,并使用数学形态学消除噪声和孤立点。在边缘检测方面,本 文比较了不同边缘检测算子的性能,并提出基于二值图像的边界检测的方法获得人群边缘,降低了算法复杂度,并通过实验表明本文所用方法的有效性 。
对于高密度人群,本文采用基于灰度共生矩阵的纹理分析方法,对纹理特征的提取和选择进行研究,并通过实验确定了灰度共生矩阵的最佳参数 ,然后引入基于统计学习理论的支持向量机进行分类,通过研究如何建立支持向量机的模型以使分类性能达到最优,实验验证了方法的可行性。
4.期刊论文 贺琳 . 李晓华 . 沈兰荪 . HE Lin. LI Xiao-hua. SHEN Lan-sun基于纹理分析和区域增长的人群图像分割 -测控技术 2007,26(5)
以局部区域为分析对象,结合人群密度估计和区域分割技术,实现了一种捕捉人群聚集点的方法.该方法首先通过纹理分析提取局部区域的人群密度特 征,然后利用神经网络分类其为不同密度级别,最后用区域增长法分割高人群密度区,即人群聚集点.
5.期刊论文 王尔丹 . 李晓华 . 沈兰荪 . Wang Erdan. Li Xiaohua. Shen Lansun基于多尺度分析和分形的人群密度估计 方法 -计算机工程与应用 2005,41(29)
人群的密度估计对于建筑物的设计和人群安全至关重要.论文提出了一种新的人群密度自动估计方法.对于低密度人群图像采用基于像素统计的方法 ,对于较高密度人群图像采用基于多尺度分析和分形的纹理分析方法,并应用支撑向量机进行人群密度等级分类.对人群图像集的实验表明,该方法较以前
的方法更为准确有效.
6.期刊论文 于艳艳 . Yu Yanyan商业社区人群密度监测系统设计 -科技广场 2008(3)
人群监控是借助于数字图像处理技术对某一区域的人群进行监控,它在社会生活和生产的许多领域有着广阔的应用前景.人群密度估计是人群监控中 的重点.现有的人群密度估计方法,对于低密度人群图像采用基于像素统计的方法,对于较高密度人群图像采用基于多尺度分析和分形的纹理分析方法,并 应用支持向量机进行人群密度等级分类.现有方法计算量较大,容易出错,且实时性较差.经试验证明,本文的方法较以前的方法更为准确有效,实时性更好.
7.期刊论文 苏航 . 郑世宝 . 杨华 . SU Hang. ZHENG Shi-bao. YANG Hua视频监控中人群流量和密度估计算法分析 -电
视技术 2009,33(11)
对视频监控领域的群体分析技术进行了研究,包括基于像素统计和纹理分析方法的人群密度估计算法和基于分割和统计回归的在景人数统计的算法 .这些算法在不同的背景下各具优点,但在实际应用中仍存在许多缺陷,需要进行改良和提升.最后,预测了对群体分析技术的发展趋势.
8.学位论文 王尔丹 基于图像处理的人群密度与运动估计研究 2005
随着我国国民经济的高速发展,人口的城市化程度越来越高,城市内很多场合的人口密度越来越大,人群作为一种特殊的管理对象,越来越受到人 们的重视。人群的有效管理需要确切地知道人群的状态。我们知道,对于流体来说,在诸多的描述参数中,密度和速度这两个参数对描述其状态至关重 要。同样的,如果把人群看作一种流体,那么在它静止不动时,人群密度是其状态的重要描述参数。当人群流动时,人群的密度和速度则是描述其状态 的主要参数。本文研究了基于图像处理的人群密度和运动的估计,应用数字图像处理,数字视频处理和模式识别等技术,估计某一固定场景内人群的密 度与运动。
本文在人群密度估计方面,提出了一种基于多分辨率分析和分形的人群密度估计方法。当人群密度较低时,利用基于像素数统计的方法,统计出人 群前景图像与背景图像像素的比值作为人群密度的度量。为了进行背景去除,本文引入了基于时间轴信息的参考背景生成方法。考虑到摄像机由透视效 应产生的几何畸变问题,本文采用一种简单的感兴趣区划分方法,较好的修正了几何畸变引起的误差。当人群密度较高时,由于人群的交叠,基于像素 统计的方法已不适用,因此本文采用基于纹理分析的方法估计人群密度。针对密度较高的人群图像,本文提出了一种基于多分辨率分析和分形的人群密 度估计方法。不同于以往的纹理分析方法,本文对人群图像具有透视效应这个问题,引入了多尺度分析,在不同尺度上分析原图像的频域特征。多尺度 分析采用小波包分解。由于小波包分解后的人群图像的子带图像有较明显的分形特性,本文应用分形维数来描述子带图像的纹理特征。另外,由于人群 图像的测试训练样本较少,本文采用支撑向量机作为分类器,提高分类准确率。通过实验验证,相对之前的人群密度估计方法,本文的方法更为准确有 效。
在人群运动估计方面,本文应用块匹配法估计人群的运动方向和运动速率。块匹配法是数字视频处理中进行运动估计最常用的方法,可计算各个块 在相邻帧间的运动。虽然相邻帧中每一个块的运动并不都是人群对象的运动,但人群作为一个集合体,其运动趋势有望与所有块的总体运动趋势相一致 。本文即通过统计一定方向上块的运动矢量总和从而判断人群的总体运动方向。另外,本文根据相邻两帧的时间间隔,估算出了人群在图像平面上的运 动速率。实验表明,本文方法估计人群运动方向与速率的结果与人工观察的结果符合得很好。
本文链接:http://d.g.wanfangdata.com.cn/Periodical_xddzjs200917035.aspx
授权使用:李桂芬(wfszkjtsg),授权号:8a9c4a85-aaec-4fe1-84f9-9e9a00af898b
下载时间:2011年3月2日
范文二:基于视频图像的人群密度估计方法研究
龙源期刊网 http://www.qikan.com.cn
基于视频图像的人群密度估计方法研究 作者:陈振宇 唐波
来源:《电脑知识与技术》 2015年第 21期
摘要:人群密度估计作为公共人群管理的重要手段,一直是智能视频监控系统研究领域的 重要方向,在公共安全、科学研究等领域有着极其广泛的应用前景。该文系统介绍了人群密度 估计的基本概念、基本流程、密度等级分类等内容。对当前研究的主流算法进行了分析比较, 进一步总结了当前研究中亟须解决的瓶颈问题,为后续研究提供了思路。
关键词:密度估计;特征提取;公共安全
中图分类号:TP18 文献标识码:A 文章编号:1009-3044(2015) 21-0137-04
Crowd Density Estimation Method Based on Video Image Research
CHEN Zhen-yu, TANG Bo
(College of Electrical Science& Engineering, National University of Defense &
Technology , Changsha 410073, China )
Abstract:Crowd density estimation as an important means of public management, has been an important direction in the field of intelligent video surveillance system research, and has a very broad application prospects in public safety and scientific research. In this paper, the basic
concept , the basic flow and the grade classification of crowd density estimation are introduced. The main algorithms in current research are analyzed and compared. The bottleneck problem need to be solved is summarized, and then the ideas for further research are provided.
Key words:density estimation; feature extraction; public safety
近年来,大量的人群聚集已经成为一个新型的,影响社会公共安全的常态性问题。一方面 是社会矛盾的激化引发大量的群体性事件,另一方面是城市公共设施和安全措施不完备所引发 的人群安全事件时有发生,这使得传统的目视视频监控系统难以满足人们的应用需求。如何利 用视频图像信息达到对人群行为的自动、客观、实时、定量的分析,实现人群异常情况的及时 预警,已经成为公共安全管理中亟待解决的重要问题。人群密度估计作为人群行为分析的基 础,一直是智能视频监控系统研究领域的重要方向,有着极其广泛的应用前景。
随着机器视觉、图像处理和模式识别等学科领域的快速发展,研究人员在人群密度估计领 域做出了大量富有成效的工作,以其为基础形成了许多富有特色的智能系统,系统的通用结构 通常包括采集单元、处理单元和控制单元三大模块。其中,采集单元主要是通过摄像机摄取人 群图像并加以储存;处理单元是采用数字图像处理技术对图像进行处理以获取人群密度或流量
范文三:基于视频的人群密度估计研究
上海大学
硕士学位论文
基于视频的人群密度估计研究 姓名:杨裕
申请学位级别:硕士 专业:信号与信息处理 指导教师:朱秋煜 20090101
摘 要
随着经济社会的发展,尤其是我国城镇化进程的推进,城市人口密度越来 越大,城市公共交通、生活设施等经常会迎来短期的人流高峰,人群的高度拥 挤若不能得到及时有效疏散容易造成灾祸。因此,基于视频系统的智能化人群 监控技术也随之受到越来越多的关注和研究。
本文研究了基于视频和图象处理的智能化人群密度估计的方法。首先介绍 了人群密度检测的国内外发展现状及其基本理论。通过分析可知,基于像素统 计的密度估计方法较为简单,但是当人群密度较高、人群遮挡严重时误差较大; 使用纹理分析的方法可以充分利用图像的纹理信息,但是算法复杂度较高。 针对以上问题,本文提出在不同密度人群情况下采用不同的密度估计算法 的解决方法。每幅图像首先通过计算前景人群象素面积将图像初步分为低密度 和中高密度两类,然后对低密度人群使用基于象素统计的方法估计人数;对中 高密度人群使用基于纹理分析的方法进一步估计密度。
对于低密度人群,本文提取人群前景像素面积以及边缘面积这两种特征, 然后利用最小二乘线性拟合方法估计出这两类特征与人数的线性关系。在获取 人群前景面积方面,本文主要采用背景差分法以及自适应阈值二值化法获取前 景人群,并使用数学形态学消除噪声和孤立点。在边缘检测方面,本文比较了 不同边缘检测算子的性能,并提出基于二值图像的边界检测的方法获得人群边 缘,降低了算法复杂度,并通过实验表明本文所用方法的有效性。
对于高密度人群,本文采用基于灰度共生矩阵的纹理分析方法,对纹理特 征的提取和选择进行研究,并通过实验确定了灰度共生矩阵的最佳参数,然后 引入基于统计学习理论的支持向量机进行分类,通过研究如何建立支持向量机 的模型以使分类性能达到最优,实验验证了方法的可行性。
关键词:人群监控,密度估计,纹理分析,灰度共生矩阵,支撑向量机
ABSTI认CT
With the fast development of economy and society,especially the progress of urbanization in our country,the population density of cities increases continuously.The public traffic and infrastructure in cities
often meet crowd flow with great density in rush hour,which may result in accidents if the population congestion call not be evacuated in time.In this situation,the effective intelligent crowd surveillance system calls a great attention in research. This paper wofks on the intelligent crowd automatic estimation technique which is based on the video and image process.Firstly we introduce the development and basic principles of the intelligent crowd monitoring system.
The analysis shows that the
pixel—based crowd
estimation is simple but the estimated error increases as the population density increases,and the texture-based crowd estimation performs better in dense population but is more complex.
To solve the problems presented above,the paper proposes to apply the different crowd estimation method according to the specific situation.We first compute the number of foreground pixels for each crowd image,and then label the image with either of the two tags,i.e.,low density or moderate—to—higll density.As a result,we use pixel-based method to evaluate the tourist number for the low density crowd and use texture—based method for the moderate-to-high density crowd.
In this paper,we characterize the low density crowd by two features:the area and the edge-length of the crowd objects,and we evaluate the tourist number by the Least-squares linear fit method with these two features.To obtain the crowd foreground of the image we apply the techniques in background abstraction and adaptive threshold binarization.We then use mathematical
上海大学硕十学位论文 基于视频的人群密度估计研究
morphology to eliminate noises and isolated points.We implement different edge detection operators in the crowd objects edge detection as well as the binary image boundary detection and compare the results.The comparison shows that the proposed binary image boundary detection is simple and
The moderate—to-hi曲density crowd is characterized
by the texture feature based on the gray-level co—occurrence matrix(GLCM).Optimum texture descriptors
are extracted by experiments in detecting different crowd density feature vectors and then classified automatically by a support vector machine(SVM)based on the statistical learning theory.An optimum multi—class
SVM model is studied and built for better classification
precision. Implementation results demonstrate that-the method is effective.
Keywords:crowd surveillance,density estimation,texture analysis,gray-level CO—occurrence matrix(GLCM),support vector machine(SVM)
上海大学硕上学位论文
原创性声明
本人声明:所呈交的论文是本人在导师指导下进行的研究工作。 除了文中特别加以标注和致谢的地方外,论文中不包含其他人已发 表或撰写过的研究成果。参与同一工作的其他同志对本研究所做的 任何贡献均已在论文中作了明确的说明并表示了谢意。
签名:扫盗 Et期:丝!乏墨12本论文使用授权说明
本人完全了解上海大学有关保留、使用学位论文的规定,即:学校有权保留论文及送交论文复印件,允许论文被查阅和借阅;学 校可以公布论文的全部或部分内容。
(保密的论文在解密后应遵守此规定)
日期:鬯2:三:2
第一章绪论
1.1人群密度检测的提出
随着我国经济建设的快速发展及城市化建设的步伐加快,人们对交通的需 求也是越来越大,然而,公共交通系统落后的管理理念和经营模式已经满足不 了城市居民的出行的需求。在交通高峰期,传统的公交调度模式往往比较滞后, 无法及时疏导出行乘客,这不仅给城市居民带来极大的不便,也容易造成安全 隐患,并严重的阻碍了社会经济的可持续发展。公共交通行业的信息化建设迫 在眉睫。
为解决这一系列问题,近年来世界各国都比较重视对交通系统管理和控制 技术的研究和开发,并致力于通信技术、自动化技术及计算机技术等现代高新 技术系统地解决道路交通问题。于是提出了智能交通系统的概念。所谓智能交 通系统(Intelligent Transportation System,ITS),包括了智能交通和智能运输两 方面的内容,它是将先进的信息技术(包括数据通信、计算机等)、传感器技术、 自动控制理论、运筹学、人工智能等有效地综合运用于交通的运输、服务控制 和车辆制造等方面,加强车辆、道路、使用者三者之间的联系,从而形成的一 种实时、准确、高效的综合运输系统,最终使交通运输服务和管理智能化,使 路网上的交通流运行处于最佳状态,改善交通拥挤和阻塞,最大限度地提高路 网的通行能力,提高整个公路运输的机动性、安全性和生产效率。
通过对公交客流信息的分析,可掌握线路客流在各时段、各方向、各断面 上的分布规律,从而为公交线网的设置、站点的设置、线路的优化以及公交调 度策略的制定与调整提供支撑和保障,解决一系列由于公交线路安排及车辆调 度不合理的问题,方便了城市居民出行,提高了公交服务水平。由此可知,对 公交客流的全面、准确把握是公交调度与公交规划的基础,因此,如何对各公 交站点以及公交车内人群进行检测估计、采集实时的客流数据,是摆在公交管 理者和调度人员面前的一大问题。
另一方面,随着经济的飞速发展,各种高层建筑、地下建筑和大型商业娱
乐设施越来越多,与此同时,人群活动也在增多,尤其是在一些重大活动中, 如娱乐活动、体育赛事、宗教仪式、庆祝活动等,常常会聚集大量人群。从古 至今,从中到外,由人群拥塞引起灾祸案例屡见不鲜。下面给出几个由于人群 堵塞引起的灾祸的案例:
1989年4月15日,在英格兰的希尔斯伯勒足球场举行足协杯半决赛。由于 大批球迷蜂拥进入看台,造成200多人受伤96人死亡。这是英国体育运动史上 最惨痛的一次灾难。此前4年,在利物浦队与意大利尤文图斯俱乐部队进行的 欧洲杯决赛中,球迷相互攻击,引起围墙倒塌,35人因此死亡[1】。
2004年2月15日,在北京市密云县密虹公园举办的第二届迎春灯展中,因 一游人在公园桥上跌倒,引起身后游人拥挤,造成踩死、挤伤游人的特大恶性 事故,有37人死亡、15人受伤[2]。
2007年11月10日上午8点20分左右,重庆市家乐福沙坪坝店在自行组织 的10周年店庆促销活动中,在超市开门时超市的玻璃门内的7米宽的19级台 阶,10多平方米的空间内瞬间涌入了100多人,随即因群众滑倒而引发踩踏安 全事故,造成3人死亡,31受伤[3】。
所有这类惨案的发生,都是由于人群过度拥挤导致人群失控造成的。伴随 着人群安全问题发展起来的人群行为和人群心理的研究,对人群安全问题发生 的原因给出了解释,但并不能从根本上解决该问题。如果我们能够自动地对人 群进行监测,及时发现人群行为的异常,就可以及时采取解决措施,避免意外 的发生。
1.2人群密度检测的目的和意义
在人口流动频繁的今天,对公共场所的人群进行有效的监测与管理,是亟 待解决的问题;同样,在经济快速发展的今天,各行各业对提高工作效率的要 求越来越迫切。人群密度监测可以应用于社会、经济的很多方面,它不仅可以 解决人群拥挤带来的安全问题,还可以应用于交通数据统计和交通调度中,提 高城市公交系统的利用率和效率。因此,人群密度估计方法的研究有着深远的 意义和广阔的应用前景。
一、人群密度监测的重要意义主要表现在:
(1)在交通调度方面,通过对交通线路中各站点以及公交车内的乘客密度的 实时监测,可以实时采集到公交客流信息并根据此信息迅速作出调度调 整。
(2)通过对现有建筑物中人群活动情况的观察统计,可以知道哪些地方容易 发生人群拥挤,从而对以后建筑物的设计及建造起到参考作用。
(3)通过对人群密度的实时监测,可以达到预防因人群拥堵而引起人群灾祸 的目的。
二、人群密度监测有着广泛的应用前景,它通常被用在:
(1)管理人群流动繁忙场合的交通。如:通过统计火车站、地铁车站、公交 候车站及公交车内的乘客密度,可以合理安排车站工作人员的工作时间 和工作额度,以及进行根据实时客流信息对地铁、公交等公共交通系统 制定有效的调度策略并及时进行调整。
(2)短期、高密度人群集中的场合。如:露天大型运动场、中心广场、大型 娱乐场地、大型会议中心、购物中心等。在这种场合下,可通过估计人 群的密度得知人群的行为和状态。
(3)预测程序化工作场合的人群流量,提高建筑设施利用率。如:获得了等 候电梯的人数,就可以提高电梯的利用率,减少用户的等候时间。 (4)进行市场调查。如:对于商场、超市等刚进的新货品,通过统计前来访 问的人数,可以知道顾客对这种新货品是否感兴趣,将此信息反馈给经 营者和管理者,将那些不受欢迎的货品拿下货架,将受欢迎的货品保留, 不仅减少了调查人员的工作量,也提高了运营速度和质量。
1.3国内外研究概况
一、传统的公交客流数据采集方法
目前,我国绝大多数城市公交企业还在沿用传统的手工客流调查方式,发 达国家使用较普遍的是电子记录收费箱(ERF,Electronic Registering Fareboxes)、
自动乘客计数系统APCS(Automatic Passenger Counting System)、公交IC卡客 流信息采集技术[4]。
这些方法各有优缺点,手工客流调查方法和电子记录收费箱成本低廉,但 是记录信息有限;基于板压和红外的自动乘客技术系统收集数据广泛实时,但 当人拥挤时计数效果不佳且成本比较大;公交IC卡客流信息采集技术简单而成 熟、采集信息量较大,在我国有较好的应用前景,但是该方法对不持公交卡的 乘客不能进行统计。目前这些方法主要是针对公交车辆上下乘客的计数,没有 对公交候车站上的客流信息进行采集和利用,且对乘客拥挤的情况不能很好地 进行计算。
二、传统的保障人群安全的途径主要有[5】:
(1)采用物理方法修正建筑物。在一些容易发生人群聚集的地方,采取适当 地修正现有建筑物的方法,比如在人多的地方增加出入口等。
(2)利用闭路电视监控某一场景。利用闭路电视对周围环境进行例行地扫描 来查找发生危险的地方,并有专门的工作人员盯着屏幕,以便发生情况 及时通报并采取措施。
这样做主要有如下缺点:
(1)不能起到预防的作用。即使人可以根据经验来发出危险警告,但由于人 的主观性太强,很容易发生预告太晚或者错误预告的情况。
(2)易造成漏报。
而当人群己经发生拥塞时,一般采取的方法是:关闭人群正在大量涌入的 入EI[1]。这种方法虽然解决了建筑物某个入口处的拥挤问题,但是人群很可能 又涌向别的入口造成新的拥挤。所以这种做法往往不能从根本上解决问题。 近年来,对人群的研究越来越引起人们的关注,对人群状态和行为的研究 也越来越多,而人群研究的前提是要弄清如何对人群进行适当的描述。虽然人 群由独立个体组成,而每一个个体又有他自己的行为模式,但作为总体的人群 有它整体性的特征,且可被描述出来。要想用精确的数学模型来描述人群的状 态和行为非常困难,但我们仍然看到了一些能够逼近人群真实行为的数学模型 的出现,比如Still G K.的人群动力学[6]。Crowd Dynamics Limited公司依据Still
G K.的数学模型应用AutoCAD做出了一些建筑设施的设计方案。
人群行为的数学模型为我们理解人群的状态和行为提供了方便,但并不能 直接用来对人群进行监控。1985年,Fruin提出当人群密度达到O.15米2/人时, 人群将很容易失去控制[7]。这就给出了人群密度与人群灾难之间的量的关系, 为借助于数字图像处理方法实现对人群的自动实时监控提供了依据。
数字图像处理[8][9】即用计算机对图像进行处理,其优点是处理精度高,可 进行复杂的非线性处理,有灵活的变通能力。数字图像处理的应用领域非常广 泛,它在包括工程、工业、医疗保健、航空航天、军事、科研、安全保卫等国 民经济中发挥着重要作用。
二十世纪以来,人群密度估计的自动方法逐渐发展起来,主要有 Davies[5][10]、Chow[11][12]、Marana[13]等人的方法。
1.4基于计算机视觉的人群监控系统
随着计算机视觉技术的不断发展,视频处理的应用也越加广泛,尤其是采 用图像序列处理技术对特定的视频运动对象的自动检测、识别、跟踪在智能监 控、智能视觉应用方面有着广泛的前景,被日益广泛地应用到各个领域[14】, 且由于数字处理器件(A/D)、数字信号处理器(DSP)芯片等的快速发展和价 格的降低,使基于实时图像信息的智能监控系统成为一个重要的研究方向。 一个典型的智能化人群监控系统由图像摄取与采集、图像处理单元和控制 单元组成【15】(图1.1)。
图1.1智能化人群监控系统的组成框图
其工作原理可以用以下步骤来描述:
(1)图像摄取与采集单元:CCD摄像机对人群按一定频率扫描,连续摄取某 一场景中的人群图像,用图像采集卡将所摄取的图像数据传输至计算机内存中。 (2)图像处理单元群图像用数字图像处理技术进行处理,得到人群的密度或 运动状态的流量数据。
上海大学硕士学位论文 基于视频的人群密度估计研究
(3)控制单元:于不同的应用场合,根据人群流量及运动状态作为相应的判 断并采取相应的措施。
随着计算机科学的迅猛发展,视频数字化、前端一体化和嵌入化、监控网 络化、系统集成化和智能化成为图像监控技术公认的发展方向,其中数字化是 网络化和前端嵌入化的前提,网络化又是系统集成化和智能化的基础[16】: (1)前端一体化和嵌入化
数字信息技术和网络技术高速发展的后PC(Post.PC)时代,随着国内外各种 嵌入式芯片和CPU产品的推广,以及各种嵌入式OS和软件开发工具的出现, 图像监控系统要求的前端一体化自然就和嵌入式技术结合在一起,成为图像监 控技术的发展方向之一。
(2)视频数字化
图像监控系统的数字化首先应该是系统中信息流(包括视频、音频等)从模 拟状态转为数字状态。信息流的数字化、编码压缩、开放式的协议,使监控系 统与安防系统中其它各子系统间实现无缝连接,并在统一的操作平台上实现管 理和控制。
(3)监控网络化
图像监控系统的网络化意味着系统结构由集总式向集散式过渡,集散式系 统采用名层分级的结构形式,拥有微内核技术的实时多任务、多用户、分布式 操作系统以实现抢先任务调度算法的快速响应。系统网络化将使整个网络系统 实现资源共享,在某种程度上打破布控区域和设备扩展的地域局限。
(4)系统集成化
图像监控系统应集成数据采集、报警联动、数据图像保存、网络安全及授 权认证等管理模块,综合了通信技术、计算机网络技术、图像处理技术、自动 化技术、模拟安防技术和系统管理软件技术,以满足客户的智能图像监控管理 需求。
(5)系统智能化
智能化图像监控系统以计算机视觉分析技术为主,融合了摄像机标定、物 体识别、运动分割与跟踪、背景建模和更新、多摄像机融合、高层语义理解等
上海大学硕士学位论文 基于视频的人群密度估计研究 多项尖端技术,具有功能强大、使用方式灵活等特点[171。
1.5论文的主要研究内容
本论文的研究内容是基于视频和图像处理等技术来实现对人群的密度估 计,具体内容包括建立训练图像库;对各种密度估计的算法进行研究、比较, 并提出新的改进的方案,为今后的进一步研究以及实现嵌入式监控系统提供理 论基础。
本文一共分为六章,安排如下:
第一章是绪论,主要介绍论文的背景,讨论了人群密度检测的来源、目的、 意义以及国内外研究的现状,并介绍了基于计算机视觉的人群密度监控系统的 工作原理以及发展趋势。
第二章详细介绍了人群密度检测的各种方法,主要有两种人群密度估计方 法:基于像素统计的人群密度估计方法和基于纹理分析的人群密度估计方法。 然后讨论了几种常用分类器。
第三章介绍了低密度人群下的人数估计方法,在前景获取方面主要讨论了 自适应背景的生成,前景二值化及数学形态学处理的相关理论知识;随后介绍 了几种常用的边缘检测算子以及基于二值图像的边界检测算法;最后介绍了估 计前景人数的最小二乘拟合方法。
第四章研究了高密度人群下人群密度估计方法,首先介绍了基于纹理分析 的人群密度估计的基础理论知识,然后介绍了基于灰度共生矩阵的纹理分析方 法以及人群密度特征的提取方法,最后介绍了支撑向量机的基本理论知识以及 用于多类分类的支撑向量机方法。
第五章介绍了基于视频的人群密度监控系统的总体框架,对第三章第四章 介绍的方法进行了实验比较、分析,证明了本文提出方法的可行性以及有效性, 最后对本文方法在公交客流信息采集的应用进行了讨论。
第六章对本文的研究做了总结,并对客流计数系统作了展望。
上海大学硕士学位论文 基于视频的人群密度估计研究 第二章人群密度检测方法的研究
2.1基于像素统计的人群密度估计
1999年香港的Chow[11][12]等人提出了使用基于混合全局学习算法的神经 网络来估计人群密度的方法。该方法主要是对监控图像进行图像处理提取出三 种特征将图像的视觉信息转化到一个二维特征空间中去描述人群密度。该方法 提取出的三种特征是:人群对象的边缘长度、人群对象的像素在整个图像中占 有的比例、以及背景对象的像素在整个图像中占有的比例。其系统框图如图2.1所示:
图2.1神经网络密度估计系统框图
该方法的特征提取基于一个假设:人群密度的大小与图像中有显著运动的 区域的“碎片’’有关。特征提取的具体操作如下:首先对视频序列进行采样, 得到静止的人群图像;再用模板对背景图像进行操作,屏蔽掉大部分复杂背景, 只留下人群对象区域的背景:然后用此背景图像对人群图像进行背景减和边缘 检测或二值化操作分离出人群对象和背景,从所得的图像中提取三种特征值:人群对象的边缘长度、人群对象的像素在整个图像中占有的比例、以及背景对 象的像素在整个图像中占有的比例,然后将这三个特征送入神经网络进行人群 密度估计。神经网络的拓扑结构是由3个输入层神经元,15个隐藏层神经元, 1个输出层神经元构成。最后采用最小均方误差分别与随机搜索(RS),模拟退
上海人学硕士学位论文 基于视频的人群密度估计研究
火(SA)和遗传算法(GA)三种全局搜索策略混合的方法找出神经网络的最 优权值。
2001年美国的Paragios等人提出了一种基于马尔可夫随机场(MRF)的实 时人群密度估计的方法【18]。该方法分为两步:第一步是区分图像前景和背景 的变化检测算法,算法使用了基于马尔可夫随机场的方法,这种方法可以保持 图像前景背景间的不连续性。马尔可夫随机场把从各种不同信息源得到的信息 (背景减、强度模型)与图像空域的信息结合起来得到一个平滑的变化检测图 像。第二步是把得到的变化检测图像与一个几何模块结合来进行透视校正,来 估计出监视区域的人群密度。
2002年Chow等人为了使他们1999年提出的基于神经网络的人群密度估 计方法[19】能够真正适用于工业应用环境(香港地铁车站)而对该方法作了改 进。改进后的系统框图如图2.2所示。
图2.2改进后的系统框图
其中增加了一个模块:旅客模板匹配(Passenger Template Matching)。这 个模块用来解决旅客站在镜头前遮挡住一部分监视区域的问题。这些旅客模板 用来在前景对象区域进行搜索匹配,匹配的结果作为特征矢量的附加维输入神 经网络进行人群密度估计。这样神经网络的输入层神经元增加到4个,而隐藏 层和输出层神经元数目不变,依然是15个和1个。神经网络最优权值的全局搜 索算法采用一种新的学习策略即最小均方误差与惩罚优化(Penalized Optimization)相混合,提高了收敛速度。
Chow、Paragios等人的方法大体上先进行背景减操作,然后对所得图像进 行像素数统计。可以是较简单的统计,如边缘像素数统计、对象区域像素数统 计等;也有比较复杂的统计,例如MRF方法,它不仅利用像素之间的时域相关
上海大学硕士学位论文 基于视频的人群密度估计研究
性还利用像素的空域相关性。这些方法优点在于:通常特征提取的计算量不大, 而且在人群密度不很高的情况下,可以比较直接的得到人群密度估计结果,这 样也节省了在估计阶段的计算量。但这类基于像素数统计的方法有一个致命的 缺陷,即在对高密度人群的估计上并不十分有效。因为这些方法并不能解决高 密度人群图像中人群重叠的问题,人群密度越大,重叠越厉害,误差就越大。
2.2基于纹理分析的人群密度估计方法
1998年,Marana提出了一种基于纹理分析技术的人群密度估计方法[20】。 他的根据是不同密度的人群图像对应的纹理模式不同:高密度的人群在纹理上 表现为细模式;低密度的人群图像在背景图像也为低频时在纹理上表现为粗模 式。基于纹理分析技术的人群密度估计方法解决了Chow等所不能解决的高密 度人群的区分问题,目前正处于进一步发展之中。图2.3是一个基于纹理分析 技术的人群密度估计的结构框图:首先,对输入图像的纹理进行统计分析,然 后提取纹理特征,将这些特征通过分类器进行分类得到密度结果。
图2.3基于纹理分析技术的人群密度估计不意图
纹理分析的方法是特征分类的基础。基于不同的纹理特征提取算法,纹理 分析方法目前主要分为四大类:统计法、结构法、频谱法和模型法。下面对这 四类方法进行综述分析:
l、统计法
统计方法是纹理分析中最基本的一类方法,目前研究较为充分,相对来说 该类方法比较成熟,主要通过统计参数来表征图像中像素灰度级分布的特征, 70年代初,Haralick等人提出了一种叫做空间灰度共生矩阵的统计方法[21】,它 是在假定图像中各像素间的空间分布关系包含了图像的纹理信息的前提下,提 出的一种具有广泛性的纹理分析方法。其他典型的方法还有Laws能量纹理法 等。这类方法一般复杂度较低,易于实现。
该方法能够很好的反映图像的空间灰度分布情况,但其计算量比较庞大。 为了提高计算速度,人们可以在提取特征前降低图像的灰度级,从而大大减少 了计算量。所以,这种方法是最为常用的方法之一。
2、结构法
直线分割法(Straight line Segments)【221。这种方法的基本思想是:先对 图像做Hough变换,然后提取直线分割后纹理的一阶统计特征。它的描述值有: (1)ML(10%)(Mean Length 10%):最长分割长度的10%的分割区域长度 的均值;
(2)ML:所有分割区域长度的均值;
(3)SDL(Sum ofDeviation ofLength).所有分割区域长度的方差;
(4)EL(Entropy oflength)?所有区域长度的熵;
(5)SDA(Sum ofDeviation ofAngle):所有分割区域的角度的方差;
(6)EA(Entropy ofAngle):所有分割区域角度的熵。
很明显这种方法的缺点是不能实现实时处理,因为图像分割会占用大量时 间。
3、频谱法
傅立叶频谱法(Fourier Spectrum)[22]。这种方法的基本思路是:纹理的 平滑度与图像的空间能量成比例。粗纹理的频谱能量主要集中在低频部分,细 纹理的频谱能量主要集中在高频部分。方法的特征量有两个:距原点为,处的 频谱值s(r)和角度为9的频谱值之和s(O)。但该方法所需特征量较多,一般在 10个以上,而且所提取的特征量应用于分类后所得正确率较低,最低为75.17%。 2001年Marana等人又提出利用小波包分析估计人群密度的方法[23]。由于 摄像机的位置关系,人群图像具有一定的透视效果,因此呈现出不同的尺度, Marana等人针对这种情况,基于以前在人群图像纹理分析方面的积累,提出一 种多分辨率分析的人群密度估计方法。这种方法利用小波包分解方法提取人群 图像的纹理特征,首先对人群图像进行二级小波包分解,得到小波系数矩阵, 分别计算这些系数矩阵的能量,最后将得到的能量值作为特征矢量送入自组织 映射神经网络(SOM)进行分类。
小波包分解法为人群图像的多尺度分析提供了有效的途径。多尺度分析可 以适应由摄像机位置产生的透视效应,并且由于纹理模式的尺度特性,使得多 尺度分析在纹理分析上具有相当的优势。但小波包分解系数的数据量巨大,计 算负担很重,而且由于如此大的数据量,有效地选择分类特征也变得比较困难。 4、模型法
分形(Fractals)方法[24】。该方法的基本思路是:纹理的平滑度与分形维 数有关。通常情况下,平滑图像的分形维数接近2,而高度粗糙图像的分形维 数接近3。具体过程:首先对输入图像作边缘检测得到一个二值图像,然后根 据不同型号的结构元素判断二值图像的膨胀度(由1到n来量度),最后将分形 维数作为分类的依据。该方法的优点是只需要一个特征量:分形维数。缺点是 对高密度和很高密度的人群的误分很大。
2.3密度分类及分类器研究
在对人群图像进行密度特征提取或个人特征提取之后,必须对这些特征进 行分类。人群密度一般情况下分为5类:很低、低、中、高、很高[13]。每类 的范围与服务级别有关。表2.1给出了1983年Polus关于服务级别的一个定义 [13][25],表2.2给出了密度分类与服务级别的关系(实验中监控面积大约是 12m2)。
表2.1服务级别定义
服务级别 人群密度(人/m2)
密度分类 人数范围(人) 密度范围以加:) 服务级别
一般地,为了得到可靠的结果,通常用3种分类器进行分类:神经网络分 类器、贝叶斯分类器和拟合函数分类器。
(1)神经网络分类器
神经网络分类法为模式分类提供了一种无需参数的途径。Kohonen提出的 自组织神经网络分类法(SOM)实现了从高维空间到低维空间的非线性投影。 人工二维自组织神经网络的匹配过程可以用以下函数表示:
厂:X—M,XcR” (2.1) McR2,X∈X,(f,/)∈M
(2)贝叶斯分类器
贝叶斯分类器是基于均方误差最小的分类方法。首先它假设在条件(2.2) 满足的情况下,模式x属于类W。
p(x wi)P(wi)>p(x wj)P(wj),J=1,...,M.Ri≠J (2.2) 其中,p(x w)是w的概率密度函数,P(w)是W类的概率,M是类的总数。所 以贝叶斯分类器取决于先验知识p(xI川和P(w),并且假定类内满足正态分布, 即p(x w)为高斯函数,同时假定所有类的分布是等概率的,高斯函数的刁和仃 由已知的样本估计得到。所以说,贝叶斯分类器是统计参数分类器的一个例证。 (3)拟合函数分类器
当己知某些模式可以由一系列的参数来描述时,那么可以用一个由这些参 数组成的拟合函数来表示这些模式,新的模式发现后新的参数也可以补充进来。 对于同一种纹理特征提取方法,选用不同的分类器得到的密度分类结果的 正确率是不同的。在实际工作中,可根据经验或者分别试验后决定采用何种分 类器。
第三章低密度下人数估计
3.1获取人群前景
基于视频图像序列的前景提取常用的有相邻帧差法和背景帧差法两种。前 者是利用相邻两帧或三帧之间图像信号的变化信息来提取运动前景;后者主要 是假设静止背景下目标与背景的灰度之间存在着一定的对比度从而提取前景。 利用相邻帧间差分法进行目标检测的主要优点是:算法实现简单;程序设 计复杂度低;易于实现实时监视;而且由于相邻帧的时间间隔一般较短,对场 景光线的变化一般不太敏感。但在应用中有二个问题,一是两帧间目标的重叠 部分不容易被检测出来,即只检测出目标的一部分或者出现了较大比例的空洞, 这是由于我们直接用相邻的两帧相减后,保留下来的部分是两帧中相对变化的 部分,所以两帧间目标的重叠部分就很难被检测出来;二是检测目标在两帧中 变化的信息,这样会存在较多的伪目标点,检测出的目标往往比实际的目标大 一些。
背景消减法可以提取出完整的目标图像,但在实际应用中仍有许多问题需 要解决。实际应用中一幅标准的背景图像总是不容易得到的,一种简单的获取 背景图像的方法是当场景中无任何目标出现时候捕获背景图像,很显然随着时 间的推移,外界的光线会变化,这会引起背景图像的变化,因而这种人工的非 自适应的方法获得的背景图像,会随着时间的推移,对场景中光照条件、大面 积运动和噪声比较敏感,出现许多伪运动目标点,不利于目标的准确检测。因 而,目前大多数监视算法己经放弃非自适应的背景图像估计方法,大部分的研 究人员目前都致力于开发不同的背景模型,进行背景的动态更新,以期减少动 态场景变化对于运动检测的影响,以适应环境的变化,即自适应背景模型估计 算法。
本文使用的方法是背景自适应更新以及自适应图像分割法来获得前景。
上海大学硕士学位论文 基于视频的人群密度估计研究 3.1.1自适应背景更新
在获取背景的方法中,本文采用视频拍摄得到的背景作为预存背景。在随 后的背景更新使用基于视频帧差(CDM,Change Detection Mask)的方法来进 行背景更新[26]。这一方法的基本假设是在视频序列中,运动人体不会始终站在 某一位置不动,而必定会移动,使背景显露出来。该方法应用各像素在时间轴上 的统计信息,生成没有人群的参考图像。人群视频空域上某一像素点的灰度值 是沿时间轴不断变化的一维随机信号。该信号的非平稳段意味着有前景人群通 过该像素点,而平稳段意味着该点表示背景图像。通过计算平稳段的灰度值的 统计平均,可得到背景图像在该像素点的灰度值。
假设图像序列的亮度分量为五O力,其中工,y表示像素位置,i表示帧数 (i=1….,加, N为序列总帧数,用式(3.1)来表示视频帧差,它反映了相邻 帧间的亮度变化:
c阴,(x,y)=…d,d<>丁T,d=‰五y)一讹y)l (3.1) 其中阈值r用来控制去除噪声。对于位置@力,CDM。(x,Y)表示了在位置 G∥)处像素点沿时间轴的变化曲线。可以根据CDM,(x,Y)是否大于零来将这条 曲线分段,并将其中被检测到的静止部分用集合Is,(x,y),1≤J≤M}表示,,如图 3.1所示。
图3.1O∥)像素点沿时间的变化曲线
其中,s/的起点和终点分别是s乃和巩。在位置@,y)对应的恼/j的集合 中,选择最长的静止分段并记录该分段中点的对应帧号为MO∥)。第批∥)帧
上海大学硕士学位论文 基于视频的人群密度估计研究
处的点用来填充视频背景中的相应位置,用下式表示:
M(x,y)=@丁(z,y)+EN(x,y))/2(3.2) B(x,y)=』G,Y,M(x,J,)) (3.3) 其中.S毗∥)和EN(x,y)是对应于最长静止分段的起点和终点,B㈣)为重建的 视频背景。
3.1.2二值化
经过背景消减法获取的前景,可以通过设置阈值得N-值图像。
脚,_{嬲;筹 B4, 其中舡力表示在像素位置@∥)处的灰度值,△r表示分割阈值,谁∥)表示 二值图像。通过设置阈值△丁,从而把灰度图像如∥)分成前景物和背景两个区 域。阈值是把图像和背景区分开的标尺,若阈值选取得太高,往往不能将运动 目标完整地分割出来;若阈值选取得太低,又会产生大量的无关噪声、如影子 等,会给后续的判决带来困难。选取适当的阈值就是既要尽可能保存图像信息, 又要尽可能减少背景和噪声的干扰。按照这样一种思想,可以将现有的二值化 方法大致分成3大类:
一、整体阈值二值化法
整体阈值法是指根据经验或灰度图像的直方图分布为整幅图像确定一个阈 值。阈值的确定一般分为两种:
1、人工设定阈值:根据经验或实验设定一个固定的阈值对图像进行二值 化。
2、由灰度直方图设定阈值:利用原始图像灰度分布的直方图能给出图像灰 度值的概貌描述。设灰度值佛值是0-255之间的整数,f=o为黑色,户255为白色。P(fk)表示灰度值为k的概率,体表示灰度为k的像素的个数, ,z为总像素的个数。则有:
上海大学硕上学位论文 基于视频的人群密度估计研究 p(以)=翌,O≤以≤255
以
(3.5)
图3.2灰度直方图
通常称以P(fk)为纵坐标,五为横坐标的图像为其灰度直方图(如图 3.2)。在灰度直方图上,前景与背景都形成高峰,在双峰之间的最低谷处 就可以做为图像二值化的阈值L波谷越深陡,二值化效果也越好。整体 阈值方法一般只考虑到整体像素的平均灰度值,并未顾及到每个像素的不 同之处,所以其二值化在总体执行速度上较快,且算法简单,易于理解, 但对输入图像量化噪音或不均匀光照等情况抵抗能力差。
二、局部阈值二值化法
对于目标和背景比较清楚的图像,全局阈值化方法可以取得较好结果。但 是如果图像的背景不均匀,或是目标灰度变化率比较大,全局方法一般就不再 适用了。由像素0∥)的灰度值厂和周围点局部灰度特性来确定像素0力的阈值叫 局部阈值二值化。局部阈值选取一般将图像划分为若干子图像,根据每个子图 像确定相应的阈值,具体的阈值确定方法同全局阈值的确定类似。
局部阈值一般用于识别干扰比较严重、品质较差的图像,较整体阈值方法 有更广泛的应用,但也存在缺点和问题,如实现速度慢、容易出现伪影现象(即 在背景域受噪音干扰)等。
三、动态阈值二值化法
应用局部阈值法后,从图像局部看来,目标特征物与背景是可分的,但是
上海大学硕上学位论文 基于视频的人群密度估计研究
无法得到一个适用于整幅图像的全局阈值,因此提出了动态的局部阈值化算法, 也称自适应阈值化算法。动态阈值选择不仅取决于像素灰度值以及其领域像素 的灰度值,并且与该像素坐标位置有关。动态是指根据每个像素及其邻域像素 的灰度值情况动态地计算分割所需的阈值。
动态阈值二值化能够处理品质较差的图像,甚至单峰直方图,但因为动态 阈值化方法常常需要对图像中每个像素点都计算阈值,即对整幅图像求出一个 阈值面(通常是曲面),计算量很大,运算速度一般比较慢。
由于本文进行二值化的图像是经过背景减后的灰度图像,前景信息已比较 明显,只是由于背景光线变化背景更新不及时等原因会带有些噪声,但是这些 经过背景减后的残留背景的灰度值通常比前景要弱,故使用基于灰度直方图的 整体阈值二值化后的图像能较好地去除残留背景,且算法简单运算速度快。
3.1.3数学形态学处理
经过背景减后的二值化图像中,可能还存在一些噪声以及断裂,可以通过 数学形态学处理使人群信息更加清晰、完整。
数学形态学将二值图象看成是集合,并用结构元素进行“探测”。结构元素 是一个可以在图象上平移、且尺寸比图象小的集合。基本的数学形态学运算是 将结构元素在图象范围内平移,同时施加交、并等基本集合运算。数学形态学 的实质是通过图象集合与结构元素间的相互作用来提取有意义的图象信息,不 同的结构元素可以提取不同层面的图像信息。常用的二值图像的形态学运算有:膨胀运算、腐蚀运算、闭运算和开运算,下面简单介绍这几种运算方法[27】:?膨胀运算
膨胀运算的运算符为“0”,图像集合A用结构元素B来膨胀,记作ASB, 其定义为:
AoB=kI[(台),n4】≠①}(3.6) 其中,雪表示B的映像,即与B关于原点对称的集合。式(3.6)表明,用B 对A进行膨胀的过程是这样的:首先先对B作关于原点的映射,再将其映像平
±海大学碗±学位论立 基十观频的^群密度估计研究
移x,当A与B映像的交集不为空集时,B的原点就是膨胀集合的像素。也就 是说,用B来膨胀A得到的集合是宫的位移与A至少有一个非零元素相交时B 的原点的位置集合。因而式(3.6)也可以写成:
t ^l
AoB=仁I[(印,n棚£卅 (37) 如果将B看成是一个卷积模板,膨胀就是对B作关于原点的映像,然后再 将映像连续地在A上移动而实现的。图3.3给出了膨胀运算的一个示意,其中 “●”号表示原点(下同)。
鞋鼹雠雠
a)集台A (b)集台B (c)B的映像 (d)膨胀结果 圈33膨胀i苣算示意幽
图(a)中的阴影部分为A,图(b)中的阴影部分为B,图(c)中的阴影 部分为B的映像,而图(d)中的阴影部分表示AoB,其中深色阴影表示图像 膨胀后扩张的部分。
?腐蚀运算
腐蚀的运算符是“e”,A用B来腐蚀记作AOB,其定义为:
AoB=瑚(B)。£A}(3.8) (3.8)式表明,A用B腐蚀的结果是所有满足将B平移x后,B仍全部包 含在A中的x集合,从直观上看就是B经过平移后全部包含在A中的原点组成
的集合。
蛀臻帮 a)集合A (b)集合B (c)腐蚀结果
上海大学硕上学位论文 基于视频的人群密度估计研究
图3.4腐蚀运算示意图
图3.4为一个腐蚀运算的示意图。图(a)中的阴影部分为A,图(b)中 的阴影部分为B,图(c)中的深色阴影部分表示AO B。
●开运算与闭运算
使用同一个结构元素对图像先进行腐蚀运算然后再进行膨胀运算称为开运 算,而相应的先进行膨胀然后再进行腐蚀的运算则称为闭运算,这两种运算也 是形态学中的重要运算。
开运算的运算符为“o
A。B=(AOB)oB (3.9) 闭运算的运算符为“?’’,A用B来闭合记为Ae B,其定义如下:
A?B=(AOB)0B (3.10) 3.2边缘检测
3.2.1边缘检测概述
边缘是指图像局部亮度变化最显著的部分。边缘主要存在于目标与目标、 目标与背景、区域与区域(包括不同色彩)之间,是图像分割、纹理特征提取 和形状特征提取等图像分析的重要基础。
边缘提取首先检出图像局部特性的不连续性,然后再将这些不连续的边缘 像素连成完备的边界。边缘的特性是沿边缘走向的像素变化平缓,而垂直于边 缘方向的像素变化剧烈。所以,从这个意义上说,提取边缘的算法就是检测出 符合边缘特性的边缘像素的数学算子。
求取边缘的过程可以用图3.5来表示,假定输入图像为触:力,加性噪声为 ,zO∽,经过边缘检测后输出为如∥),边缘检测响应为五G∽,检测函数JizO力 即为相应的边缘检测算子。
上海大学硕士学位论文 基于视频的人群密度估计研究 眠¨爷一g(x,y) 3.2.2常用边缘检测算子
边缘检测算子检查每个像素的领域并对灰度变化率进行量化,通常也包括 方向的确定。大多数方法是基于方向导数模板求卷积的方法,微分运算是边缘 检测与提取的主要手段。由于我们常常无法事先确定轮廓的取向,因而挑选用 于轮廓增强的微分算子时,必须选择那些不具备空间方向性的和具有旋转不变 的线性微分算子。常用的边缘检测算子包括:Roberts算子、Sobel算子、Canny 算子等。下面分别介绍这集几种算子:
一、Roberts算子
Roberts边缘算子采用的是对角方向相邻的两个像素之差,是一种利用局部 差分算子寻找边缘的算子,它由下式给出:
Roberts算子:G[f,.,]_If[i,刀一九f+1,j+1]l+Jf[i+l,.,卜儿f,/+1]l (3.11) G[i,.,]=[(九f,,]一f[i+1,J+1】)2+(九f+1,J】一f[i,J+1])2】“2(3.12)
该算法的算子为:墨一0。][一0。习
通过差分可以求得Roberts算子在差分点(掣,二})处连续梯度幅度的近 似值G(i,J),适当选取阈值f,如果G(i,J)>f,则认为点(f,/)是边缘点。
Roberts边缘算子采用对角线方向相邻两像素之差进行梯度幅度检测,其检 测水平、垂直方向边缘的性能要好于切线方向边缘,并且检测定位精度比较高, 但对噪声敏感。
二、Sobel边缘检测算子
Sobel边缘检测算子在以像素点为中心的3×3邻域内做灰度加权运算,根 据该点是否处于极值状态进行边缘检测,其本质上仍是一种梯度幅值。它由下
上海大学硕士学位论文 基于视频的人群密度估计研究
G[f(i,j)]=lao,I+IAG,l (3.15) 髓州蚓
点(f,/)是边缘点。
Sobel边缘检测算子不但可以产生较好的边缘效果,而且对噪声具有平滑作 用,减小了对噪声的敏感性。但是,Sobel边缘检测算子也检测出了一些伪边缘, 使得边缘比较粗,降低了检测定位精度。在检测定位精度要求不是很高的情况 下,Sobel算子是比较常用的边缘检测算子。
三、Canny边缘检测算子
传统的计算方法是用模板在图像中每个像素的邻域进行卷积运算,如 Robe,s、Sobel等算子,这些算子的主要缺点是对噪声的敏感和边缘定位精度 低。为了对边缘检测方法的有效性进行评价,Canny提出了边缘检测准则,并 用数学方法系统的推导出确定图像边缘检测函数性能指标的数学表达式。寻取 的准则依赖以下两点:
(1)具有最大的边缘信号输出信噪比SNR:
信噪比越大,提取得边缘质量越高。信噪比SNR定义为:
I一卜w I
|I f(-x)h(x)dxI
SNR:上;————』 (3.16) 仃、/上。^2@)dr
其中w代表滤波器的带宽,盯代表高斯噪声的均方差。
(2)边缘的定位精度:
上海人学硕士学位论文 基于视频的人群密度估计研究 边缘定位精度L如F定义:£:!唑
@∽
盯√胁2扛)ax 其中m)和Jlz’∽分别是胸和Jiz∽的导数。三越大表明定位精度越高。
以上述指标和准则为基础,利用泛函求导的方法可导出Canny边缘检测算 子是信噪比与定位之乘积的最优逼近算子,表达式近似于高斯函数的一阶导数。 其一阶导数冲击响应函数五∽:
揪卜砉唧(-吾)
@㈣ Canny边缘检测算子的基本思想是:首先对图像选择一定的Gauss滤波器 进行平滑滤波;然后采用非极大值抑制(Non.maxima Suppression)技术对平滑 后的图像处理,得到最后的边缘图像。从本质上讲,Canny检测算子属于具有
平滑功能的一阶微分算子。 设Gauss滤波函黼G∽=去2
exp(一孚]n柳 万仃 I 盯。 , 用分解的方法将梯度矢量VG的两个滤波卷积模板分解为两个一维的行列滤波 器:
aG . ——=舡 苏 aG .
万2砂 X220-2X220
(3.20) 将这两个卷积模板分别与图像m圳进行卷积计算,得到输出:
E:i,gG宰厂(z,少)E,:iaG木厂(x,y) (3.21)
¨(f,舻瓜丽丽州“问t吨嬲]
(3.22) 式中,彳(f力反映了图像贝fD点处的边缘强度,口(f,/)是图像火f力上(f力点处
的法向矢量(正交于边缘方向的法向)。 根据canny定义,中心边缘点位算子VG与图像f(x,Y)的卷积在边缘梯度
甑
饮 %甑
上海大学硕士学位论文 基于视频的人群密度估计研究
方向上的区域中的最大值,这样Canny边缘检测算子的检测步骤为:
(1)用高斯滤波器平滑图像。
(2)用一阶偏导的有限差分计算梯度的幅值和方向,即:
Ex
E y ≈兰f!:』3二兰竖±!:』3±兰丕:』±13二兰[!±!!』±13(3.23) 2
(3)对梯度幅值进行非极大值抑制:以图像舡力上(∽点处的边缘强度A(ij) 值的大小并不能确定该点是否为边缘点,需要采用非极大值抑制确定边缘点, 即细化幅值图像中的屋脊带,保留幅值局部变化最大的点。
(4)用双阈值算法检测和连接边缘:设定两个阈值■和乃(L>■),对非极大 值抑制图像进行双阈值化,可得到一个高阈值检测结果和一个低阈值检测结果。 然后在高阈值检测结果中连接边缘轮廓,连接到端点时,到低阈值检测结果中 寻找边缘点,直到高阈值检测结果所有间隙连接起来为止。
3.2.3基于二值图像的边界检测
使用边缘检测算子对前景图像进行边缘检测,其检测结果对噪声比较敏感, 容易检测出伪边缘,并且常用的微分算子算法复杂度相对较高。考虑到本文在 检测低密度人群时都需要对前景人群进行二值化,因此在边缘检测时可以选用 直接对二值图像进行边界检测获取图像边缘。该方法基本思想是判断当前非零 点(本文取背景为0,前景为1)及其周围4个或8个相邻点的值来判断是否为 边界点。如图3.6,以四领域法为例,(a)图中1为前景点,0为背景点,若一 非零点的上、下、左、右四个邻点有任一点的像素为0,则判断该点为边界点; 否则,若其相邻点像素均为0,则判断该点为内点。使用这一原理获得的边界 如(b)图所示。
上海大学硕士学位论文 基于视频的人群密度估计研究
0O O 00 001l 0 0l l l 0 011O O 00O 0O 00O 00 0O 1l O 0l 0l 0 O 110O 00O O 0
(a)二值图象 (b)边界
图3.6基于二值图象的边界检测
3.3最小二乘曲线拟合
在许多应用领域中,人们经常面临用一个解析函数描述数据(通常是测量 值)的任务。对这个问题有插值和曲线拟合或回归两种方法。曲线拟合或回归 是指设法找出某条光滑的曲线,它最佳地拟合数据,但不必要经过任何数据点 [28]。当最佳拟合被解释为在数据点的最小误差平方和,且所用的曲线限定为 多项式时,那么曲线拟合是相当简捷的。数学上,称为多项式的最小二乘曲线 拟合。本文使用曲线拟合的方法来描述人群数目与前景像素数以及前景人群边 缘数的关系。
假设在坐标图上,已知数据点(Xk Y。),多项式拟合函数表达式为
开 一
y=∑口,x‘(n≥2),我们称数据值y女与拟合函数表达式计算出的九=∑口。也i之 i=0i=0
间的误差为残差:
ek 2
y k—yk (3.24)
若(Xk Y。)在曲线上,则%=0,否则%的大小反映了点(以,Y。)偏离曲线 的程度。由于测量误差等因素的影响,残差一般不为零。但可通过使残差在某 种意义上达到最小这一思想来确定参数口,,一般有如下几种参数的确定方法: (1)使残差的最大绝对值达到最小,即等价于求参数口,,使得:
耻max{叫=maxI驴静z:f=幽 B25,
该方法又称为最大最小问题或最优一致逼近问题,其所确定的参数使得最 大误差达到最小,这类问题在求解上存在一定的困难。
(2)使残差绝对值的平均值达到最小:
I 肛 l
s。=∑IP。I=∑ly。一∑x。il=min (3.26)
k k i=O 该方法所确定的参数使得平均误差达到最小,由于函数S.关于参数不可微, 不能用一般的多元函数取极值的充分条件,即不能用偏导数等于零的方法确定 参数,因此和第一种方法一样,在求解时也存在困难。
(3)使残差的平方和达到最小,也即最d'--乘曲线拟合:
(3.27)
该方法所确定的参数使得均方差达到最小,这种逼近称为最小二乘逼近。 由于S:关于参数连续可微,因而在计算_tzg;于处理。
Davies等人曾提出人群人数与像素数成正比的关系[10】。实际上,人群人 数与像素数成正比关系是在人群无遮挡且每个人在图象中所占比例相同的假设 下才成立,若人群遮挡严重或者由于摄象机的远近效应造成不同位置的人在图 象中所占比例不同,该正比关系是不成立的。考虑到本文中监控场景的远近效 应不是很严重,因此本文在人群遮挡较少的情况下使用直线拟合方法拟合人群 人数与前景像素数以及前景人群边缘数的关系。拟合函数为:y=ax+b,下面推 导对于最小二乘拟合直线中系数a和b的计算方法。
由微分学知识,参数a和b必须满足如下一阶必要条件:
鲁=等=。 B28, ——;=—‘=I, f。{7X1
aa ∞ 、 7
即:
9. 23O lI O
七 =k 卜 y y 一 一 66++№
陋 。 ∑ 榭 。 ∑ 捌 22==鱼缸堕动
化简得:
上述线性方程组称为正规方程组或法方程组,
a 2 b= 加(11'1∑ 七=l
∑
七=l
\/m
xl,Y。I-I∑
/\k=l
/,m 、 ,,
mI∑x斗一l
\、k=l /\
x:)(∑ k=l
∑以Y。
kM
解得:
、,,in
以膳
∑
k=l ‰)2
y0
y。)—-(善。r。](善x。y。]聊陲).(∑ k=l ‰)2
(3.30) (3.31) 口
.、,
砂 。 ∑ 榭 。 ∑ 胤 尸
几U
+
X
弘 。 ∑ 料
X
卜
。∑揣虮
上海大学硕士学位论文 基于视频的人群密度估计研究 第四章高密度下人群密度估计
4.1基于纹理分析的人群密度估计研究
4.1.1纹理分析基本概念
用各种观测系统取得的图像很多是纹理型的,可以从图像的纹理分析中提 取很多有价值的宏观信息。纹理分析是从对遥感图像分析技术中发展起来的。 遥感图像分类技术一直立足于单像元的光谱能量信息,后来这种分类方法难以 满足各式各样的实际要求,于是人们陆续提出了空间信息、多时相信息的概念。 空间信息是指图像数据在空间分布上所包含的纹理、局部结构信息和形态 信息。无论从理论还是常识出发,纹理信息都是显然应该成为描述与识别图像 的一项重要数据。与其他图像特征或描述相比,纹理性质似乎能更好的兼并图 像的宏观性质与细部结构的两个方面[29][30]-
尽管纹理在图像分类和图像分析中是很重要的特性,并且使用的很广泛, 且在直觉上可能是很明显的,但是由于它的变化范围很宽泛,因而并没有精确 的定义。一般认为纹理就是指在图像中反复出现的局部模式和它们的排列规则 [3l】。
纹理特征就是图像局部性质(灰度分布函数)的统计[32】。从人们的感知 经验可知,粗糙性和方向性是人们区分纹理所用的两个最主要的特征。构成纹 理特征的两个要素如下:
(1) 纹理基元:图像中最基本的单元是像素,由像素组成的具有一定形 状和大小的集合,如圆斑、块斑、花布的花纹等,这些有一定形状 和大小多钟图像基元的组合叫做纹理基元。
(2) 纹理:纹理是由纹理基元排列组合而成的。基元排列的疏密,周期 性,方向性等的不同。能使图像的外观产生极大地改变。
上海大学硕士学位论文 基于视频的人群密度估计研究 4.1.2纹理分析方法
纹理分析是指通过一定的图像处理技术抽取出纹理特征,从而获得纹理的 定量或定性描述的处理过程。它首先从像素出发,检测出纹理单元,并找出纹 理基元排列的信息,建立纹理基元模型。因此纹理分析应包括两个方面的内容:检测出纹理基元;获得有关纹理基元排列分布方式的信息。
纹理分析方式如下:
(1) 纹理的模型分析:在不知道纹理基元或尚未检测出基元的情 况下进行纹理分析,我们只能从最小基元——像素开始建立 纹理特征的模型。
(2) 纹理的结构分析:在已知基元的情况下进行的分析。
纹理分析方法主要有两类:一类是统计的方法;另一类是结构分析的方法。 统计方法常用于分析象木纹、沙地那样的纹理细而不规则的物体。结构分析的 方法常用于印刷或砖花样等一类纹理基元及其排列较规则的图像。
统计纹理描述方法以适合统计模式识别的一种形式来描述纹理。作为描述 的一个结果,每个纹理以一个属性特征向量来描述,它代表了多维特征的一个 点。这方面的方法主要有:
(1) 基于空间频率的方法:度量空间频率是一大类纹理识别方法的基 础。纹理特征直接与纹理基元的空间大小相关。粗糙纹理由较大的 基元组成,精细纹理则由较小的基元构成。精细纹理由较高的空间 频率表征,粗糙纹理由较低的空间纹理表征。
(2) 共生矩阵:它是基于在纹理中某一灰度级结构重复出现的情况。这 个结构在精细纹理中随着距离而快速地变化,而在粗糙纹理中缓慢 地变化。
(3) 基元长度:具有相同灰度级的大量的相邻像素反映了粗糙的纹理, 少量的这些元素则反映精细纹理,而在不同方向上的纹理基元的长 度可以作为一种纹理描述。
(4)Law的纹理能量度量:Laws的纹理能量度量通过估计纹理中的平 均灰度级、边缘、斑点、波纹以及波形来确定纹理属性。
由于人群图像的纹理大多为随机型纹理,服从统计分布规律,因此,本文 采用统计法分析人群图像的纹理特征。
4.2基于灰度共生矩阵的纹理分析方法
4.2.1灰度共生矩阵定义
我们知道相邻某一间隔长度的两个像素,它们之间要么具有相同的灰度级, 要么具有不同的灰度级,若能找出这样两个像素的联合分布的统计形式,对于 图像的纹理分析很有意义。灰度共生矩阵特征分析法就是研究图像中两个像素 的联合分布的统计形式,通过这种方式得到的纹理特征称为二次统计量。 灰度共生矩阵通过计算图像中特定方向和特定距离的两像元间从某一灰度 过渡到另一灰度的概率,反映图像在方向、间隔、变化幅度及快慢的综合信息。 它是描述在0方向上,相隔一定的像元距离d,灰度级分别为f和,的像元对出 现的频率p(i,/),即为矩阵的元素。其中ij=O,1,2,...工一l为图像的灰度级数。 这样两个像素灰度级同时发生的概率,就将∞)的空间坐标转换为(f力的 “灰度对”的描述,形成的矩阵称为灰度共生矩阵。灰度共生矩阵也可以理解 为像素对的直方图。
如图4.1,秒方向一般取00、450、900和1350等4个方向。灰度共生矩阵 是一个集合,集合中的一个元素[尸(f,J Jd,口)]表示所有在9方向上,相隔像元距 离为d的像素,一个灰度为f值,另一个灰度为,值的相邻对数。灰度共生矩阵 反映了图像灰度关于方向、相邻间隔、变化幅度的综合信息,可以作为图像基 元和排列结构的信息。
P缸I of Inte rest O。[a D】
图4.1灰度共生矩阵角度示意图
下面给出了如何产生灰度共生矩阵的实例:
如图4.2所示,图像I有8个灰度级别,取d=l。在p=00方向上,图像由 l变化到1的变化次数共有1次;由l变化到2的变化次数共有2次。 厂、\.1
234567B 11)568BL(矩 11、120
01000、‘-一 .一 2357120知 1
010O a —— —— 彳 一一 00
O 1a 00__r 一 哆 a O 0
a 1a O 口 457《 12,L _85{■ 12芦 L 51O O
O Q 12O ‘ 0a a
O 0a a 172a 0
O 00a 0I 000a 1O O 0
图4.2灰度共生矩阵不意图
矩阵元素值的分布与图像的信息丰富程度密切相关:
(1)灰度共生矩阵的非零元素值如果集中在主对角线(灰度值相等的像素对) 上,则说明检测域(也称为子图)的图像信息量在该统计灰度共生矩阵的方向上 低,如果非零元素值在非主对角线上分布,且比较分散,则说明检测域在该方 向上图像灰度变化频繁,因而具有较大的信息量。
(2)如果靠近主对角线(即一定位置关系的两个像素的灰度值相差不大)的 元素值较大,则说明图像的纹理比较粗糙,反之,如果离主对角线较远(即一定 位置的两个像素的灰度差值大)的元素值较大,则表明图像的纹理比较细。因此 灰度共生矩阵元素相对于主对角线的分布情况,反映了图像纹理的粗细程度。
上海大学硕上学位论文 基于视频的人群密度估计研究 4.2.2人群密度特征提取
在实际应用中,作为纹理识别的特征量[33】是由上述的灰度共生矩阵计算 出来的一些统计量。灰度共生矩阵的统计特征是将可视纹理特性转化成定量的 描述,通过定量的分析以区分目标类型特性。Haralick曾提出14种由灰度共生 矩阵计算出来的统计量。即:能量、熵、对比度、均匀性、相关性、方差、和 平均、和方差、和熵、差平均、差方差、差熵等、相关信息测度以及最大相关 系数,下面介绍一下本文用到的5种纹理特征参数:
(1) 能量特征(Energy):纹理一致性统计量
L-I L-I
SE=∑∑印(f,/I d,乡))2(4.1)
能量又称角二阶矩,是灰度共生矩阵元素值的平方和,反映了图像灰度分 布均匀程度和纹理粗细度。如果共生矩阵的所有值均相等,则能量值小;相反, 如果其中一些值大而其它值小,则能量值大。当共生矩阵中元素集中分布时, 此时能量值大。能量值大表明一种较均一和规则变化的纹理模式。
(2) 对比度(Contrast):纹理反差统计量
对比度反映了图像的清晰度和纹理沟纹深浅的程度。纹理沟纹越深,其对 比度越大,视觉效果越清晰;反之,对比度小,则沟纹浅,效果模糊。对比度 大的象素对越多,这个值越大,即灰度共生矩阵中远离对角线的元素值越大, 对比度越大。
(3) 相关性特征(Correlation):纹理灰度相关统计量
∑Zi,jp(i,/l d,O)-,u。∥2sco,2坐Li丁一
(4.3)
式中∥l,∥2,盯l,or2分别定义为:
L-I L-1∥:=∑/∑p(蚓d,9) (4.4)(4.5)
、J 9d O p ¨∑间 ¨∑硼 =∥
L-1£一l
盯;=∑(j-p:)2ZP(i,J d,秒)(4.6)(4.7) 相关性度量灰度共生矩阵元素在行或列方向上的相似程度,当矩阵元素值 均匀相等时,相关值就大;相反,如果矩阵元素值相差很大则相关值小。如果 图像中有水平方向纹理,则水平方向矩阵的相关值大于其余矩阵的相关值。 (4) 逆差矩特征(Homogeneity).纹理灰度相关统计量 &=善鬈筹 ㈤,
逆差矩度量图像纹理局部变化的大小。其值大则说明图像纹理的不同区域 间缺少变化,局部非常均匀。
3,熵(Entropy)-测量灰度级分布随机性的特征参数
£一1£一1
Sp=一∑∑比J d,O)logp(i,.J『I d,目) (4.9)
i=0j=O
熵是图像所具有的信息量的度量,纹理信息也属于图像的信息,是一个随 机性的度量,当共生矩阵中所有元素有最大的随机性时,熵较大。它表示了图 像中纹理的非均匀程度或复杂程度。
4.3分类器研究
4.3.1模式分类
模式分类是模式识别中一项重要内容,分类也是人们认识事物的基础,许 多优秀的学习算法都是以分类理论为基础发展起来的。目前,用于模式分类的 方法很多,传统的方法有贝叶斯方法、距离判别、Fisher判别、协近邻分类以 及分段线性分类等[34],现代的方法如模糊分类[34】,粗糙分类[35】、神经网络 分类[34】、支持向量机分类方法[36]以及分类器的集成学习[36]等。模式分类方 法己经在医学诊断、机械故障诊断、语音识别、人脸识别等领域得到了广泛的 应用。
一、贝叶斯分类器
、, 臼 d 0p 川∑脚 、, ∥ 一 p ¨∑础 II 2l 盯
20世纪40年代末,Wald建立了贝叶斯理论为核心的统计决策理论[37】。 随后,以Robbins H.为代表,提出将经验贝叶斯方法与经典统计决策方法相结 合[381139],引起了统计学界的广泛关注。
贝叶斯学习理论利用概率的形式来表示变量间的依赖关系,通过先验信息 和样本数据来获得对待识别对象的估计。贝叶斯最大后验概率准则是贝叶斯方 法决策规则中的基础分类规则,使分类错误最小的最优分类规则导致最小错误 贝叶斯决策规则,而错误分类代价的引入导致了最小风险贝叶斯决策规则,且 这几个理论均假定先验概率和类条件概率已知,然而,这些概率密度在许多实 际应用中是未知的。而需要根据已获得正确分类的样本集(训练集)对其进行 估计,先验概率既可以借助人的经验、专家的知识来确定,也可以通过分析样 本数据的特点直接获得,后者要求有足够多的数据才能真正体现数据的真实分 布[40]o .
贝叶斯方法的优点是可以利用人的先验知识,而缺点是当假设模型与样本 实际分布情况不相符时,就难以获得较好的效果。
二、神经网络分类器
神经网络具有对非线性数据快速建模的能力,通过对训练集的反复学习来 调节自身的网络结构和连接权值,并对未知的数据进行分类和预测。几乎所有 神经网络学习算法都可以看作Hebb学习规则的变形。Hebb学习规则的基本思 想是:如果神经元“;接收来自另一神经元U,的输出,则当这两个神经元同时兴 奋时,从“,到U,的权值w:f『就加强[341。
人工神经网络的以下几个突出的优点使它引起人们的极大关注:
(1)可以充分逼近任意复杂的非线性关系;
(2)所有定量或定性的信息都等势分布贮存于网络内的各神经元,故有很强 的鲁棒性和容错性;
(3)采用并行分布处理方法,使得快速进行大量运算成为可能:
(4)可学习和自适应不知道或不确定的系统;
(5)能够同时处理定量、定性知识。
但是由于神经网络是基于经验最小化原理,它有如下几个固有的缺陷:
(1)结构复杂(神经元的结构,还有输入层,隐含层,输出层组合起来的复 杂结构),且结构设计依赖于设计者的先验知识和经验,缺乏一种有理 论依据的严格设计程序:
(2)容易陷入局部极小;
(3)没有一种理论定量的说明神经网络的训练过程是否收敛以及收敛的速 度取决于什么条件,从而能对其加以控制;
(4)容易出现过学习问题,也就是训练出来的模型推广能力不强。
三、支撑向量机
为了克服传统神经网络的以上缺点,Vapnik提出了一种新的基于统计学习 理论的机器学习算法一支持向量机,正式奠定了SVM的理论基础,由于SVM 扎实的理论基础,其目前已经成为继神经网络之后的的机器学习领域研究热点 之--[41】。它是在结构风险最小化原则基础上建立起来的小样本学习理论具有 很强的学习能力和泛化性能,能够较好地解决小样本、高维数、非线性、局部 极小及过学习等问题,可以有效地进行分类、回归、密度估计等。
支持向量机理论是从线性可分情况下的最优分类而发展而来的。SVM基本 原理是寻找一个最优分类超平面,使两类样本距离最优超平面的距离最大化。 在线性不可分的情况下基于1909年Mercer核展开定理可以通过非线性映射把 样本空间映射到一个高维乃至于无穷维的特征空间(Hilbert空间),使在特征空 间中可以应用线性学习机的方法解决样本空间中的高度非线性分类[42】。
支持向量机的分类算法具有4个显著特点:①利用大间隔的思想降低分类 器的VC维,实现结构风险最小化原则,控制分类器的推广能力;②利用Mercer 核实现线性算法的非线性化;③稀疏性,即少量样本(支持向量)的系数不为 零,就推广性而言,较少的支持向量数在统计意义上对应好的推广能力,从计 算角度看,支持向量减少了核形式判别式的计算工作量;④将算法设计成凸二 次规划问题,避免了多解性[43]。
支持向量机最初是用来解决两类问题的,不能直接用于解决多类问题。目 前解决多类问题的途径主要有两个:一个就是Weston等人提出多类算法为代 表;另一个就是利用将两类问题扩展到多类问题的方法策略[40],将多类分类
范文四:场景监控中的人群密度估计
第 12卷 第 6期 电路与系统学报 Vol.12 No.6 2007 年 12 月 JOURNAL OF CIRCUITS AND SYSTEMS December , 2007
文章编号:1007-0249 (2007) 06-0019-04
场景监控中的人群密度估计 *
胡波, 李晓华, 沈兰荪
(北京工业大学 信号与信息处理研究室,北京 100022)
摘要 :人群密度估计是智能化人群监控中十分重要的内容,它对于人民群众的生命安全有着重要的作用和意义。 本文提出了一种基于小波变换与灰度共生矩阵的人群密度特征提取方法,进而利用支撑向量机实现人群密度级别的估 计。实验结果表明本文提出的方法是可行的。
关键词:人群密度估计;小波变换;灰度共生矩阵;支撑向量机
中图分类号:TP391 文献识别码:A
1 引言
随着人们社会活动的不断增加,由于人群密度过大而造成人员伤亡的事件屡见不鲜。在日常生活 中,对于人们经常出入的地铁、车站、超市等地点的人群密度估计是十分必要的。因此,人群密度估 计有着广泛的应用前景和研究价值。
传统的人群密度估计通过监控场景的闭路电视人工进行监控,费时费力且缺乏客观性。随着计算 机和图像处理技术的发展和广泛应用,智能化的人群密度监控系统成为人们研究的重点。
在 London 和 Genova ,有两个基于闭路电视的实时人群密度监控系统 [1,2]。然而这些系统只是运用 了一些较为简单的图像处理方法来提取图像中人群密度特征。一是运用背景减的方法来判断场景中被 人群占据的空间的大小;二是运用边缘提取的方法,通过边缘周长检测来估计人群密度。然后通过 Kalman 滤波器对这两种特征进行联合判断, 得到优化后的人群密度估计结果。 这项技术在较低的人群 密度下能得到较满意的结果,但是应用于人群密度较高的场景时会出现很高的误判率。原因在于高密 度人群存在明显的人与人间的重叠现象,而上述的两个特征很难描述这种现象。
针对现有方法对中高密度人群估计的缺陷,本文引入纹理分析的方法描述人群密度特征,提出了 一种基于小波分析和灰度共生矩阵的特征提取方法,并运用支撑向量机进行人群密度分类,取得了较 好的试验结果。
2 算法整体框架
本文方法的算法框图如图 1所示。
算法主要分为两大部分:特征提取和特征分类。特征提取包括小波变换和灰度共生矩阵,支撑向
量机用于分类。
依算法框图所示,首先对图像进行三级小波分解,得到 10个子带及相应的小波系数;其次对除 LL 子带外的所有细节子带分别计算灰度共生矩阵;然后,计算相应的统计纹理特征,生成 9维特征矢 量;最后,利用支撑向量机进行特征分类,得到人群密度级别。
3 小波变换与灰度共生矩阵联合的特征提取
3.1 小波变换
小波分析 [3,4]在图像处理中的运用愈加广泛,它能够在时域和频域同时具有优良局部特性。
在本文中,对人群图像作 3级小波分解 [4],得到分解前后的图像,如图 2(b)所示。从小波分解后
* 收稿日期:2004-10-26 修订日期 :2005-12-21
4042008)
图 1 算法框图
20 电路与系统学报 第 12卷
图像中可以看出,不同分辨率的细节子图显示 出了人群图像不同方向上的纹理状况,这对于 下一步的特征提取有很大帮助。
本文采用 9/7滤波器组进行三级小波变 换,以九个高频子带作为特征提取的基础,分 别从这九个子带中提取纹理特征。 3.2 灰度共生矩阵
在纹理图像中,某个方向上相隔一定距离的一对像素灰度共同出现的统计概率,能反映这个图像 的纹理特征 [5]。灰度共生矩阵法 [5]正是建立在估计图像的这种二阶联合条件概率密度函数基础上的一 种重要的纹理分析方法。灰度共生矩阵 ) , , (?d j i p 被定义为从灰度值为 i 的点离开某个固定位置(相隔 距离为 d 、方位为 ?)的点上灰度值为 j 的概率(或者频数) 。对应于变化缓慢的纹理图像,其灰度共 生矩阵对角线上的数值较大;而对应纹理变化较快的图像,其灰度共生矩阵对角线上的值较小,对角 线两侧的值较大。
灰度共生矩阵 ) , , (?d j i p 反映了图像灰度分布关于方向、 局部邻域和变化幅度的综合信息, 但数据 量太大,一般并不直接作为区分纹理的特征,而是基于它构建一些统计量作为纹理分类特征。
小波变换后的人群图像(图 2(b))突显了人群的纹理变化情况,且有不同的分辨率和角度的信息。 灰度共生矩阵则对于不同分辨率的小波子带进行纹理分析, 最后选择合适的特征统计量表征纹理状况, 反映人群密度情况。本文方法利用了小波变换和灰度共生矩阵纹理分析上的各自的特点,将其结合运 用,使其效果好于其中一种的单独运用。
本文采 用了 多次实 验求 取最 优 的方 法。表 1给出了多次测试中的三组不同特 征下的试验结果,其中最右侧为多次实验 中的最优方案。 特征组合中的 Energy 定义 为:∑∑?=?==101
02)], , ([) , (L i L j d j i p d E ??。
表 1中采用同样的小波分解以及不同特征组合,可见特征组合的选取对检测准确率有很大影响。 通过选取不同的特征组合,经多次测试比较,选用表 1中最右侧的特征组合作为最优特征组合:
HL-Homogeneity , LH-Homogeneity , HH-Contrast , 1=d , D 90=?, 其中逆差矩(Homogeneity )定义为:
) , , ()
(11
) , (10
1
02
??d j i p j i d L L i L j ∑∑
?=?=?+= (1) 对比度(Contrast )定义为:
∑∑?=?=?=101
02) , , () () , (L i L j d j i pp j i d I ?? (2)
对比度(Contrast )是反映图像纹理清晰程度的物理量,纹理的沟纹越深,则其对比度越大,图像 视觉效果越是清晰。低密度人群的对比度较高,高密度人群情况与其相反。疏密情况恰能体现在对比 度的变化上。从定义式看,统计量逆差矩(Homogeneity )是与对比度相对应的物理量。从人群图像纹 理的特点分析,这两种特征能够很好的表征人群密度的变化,而能量(Energy )在反映人群密度所带 来的纹理变化上,有所不足。
整个特征提取过程如下:
(1)对原图像进行 3级小波分解,生成小波图像; (2)对除 LL 子带的每个子带计算其灰度共生矩阵;
(a) 原始人群图像 (b) 三级小波变换后的图像
图 2 原始图像和 3级小波变换后的图像
表 1 两组特征测试结果比较
HL-Energy LH-Homogeneity HH-Homogeneity
HL-Homogeneity LH- Energy HH-Contrast
HL-Homogeneity LH-Homogeneity HH-Contrast
测试样本准确率
83.8% 90% 95% 训练样本准确率
95.8% 97.2% 96.5%
第 6期 胡波等:场景监控中的人群密度估计 21
(3)按公式(1) (2)确定子带特征值,生成 9维特征矢量。
4 分类器
由于本文所用的人群图像数量有限,分类器选择支撑向量机。支撑向量机非常适用于小样本的分 类且分类效果好。
支撑向量机 [6]的基本思想是:通过非线性变换将原始特征空间变换到一个高维的空间,在这个新 空间求取线性最优 s 分类面,而这种非线性变换是通过定义适当的内积核函数来实现的。
它的判别函 s 数为
()??
?
???+=∑=s i i i b K y αy 1sgn X , X i (3)
其中 ()?sgn 为符号函数, ) (' X X, K 是内积核函数。
输入特征向量为 ) (d 21x , , x , x X
本文中将实验图片按人群密度的不同分为四类。 考虑到支撑向量机一般只能实现两类模式的划分, 这里共采用 3个支撑向量机进行分类。其结构如图 3所示。
实验中,采用交叉验证法确定三个分类器所用的内积核函数 及其参数,如表 2所示。
其中:poly 为多项式核函数: p i i K 1][) (+?=X X X X, ,其中 p 为待定参数 (4)
rbf 为径向基核函数: ?
??
?
????×??=222exp ) (p K i i X X X X, ,其中 p 为待定参数 (5) 5 实验结果及分析
试验所用的图片采自北京西客站,共 300张。 将它们按人群密度不同分为四类:低、中低、中高 和高,见表 3。表 4为本文方法实验测试结果。
为了便于对比,本文对仅基于灰度共生矩 阵 [7](对整幅图像的灰度共生矩阵求取以下特 征量作为特征:Homogeneity 0°; Homogeneity 45°; Homogeneity 90°; Homogeneity 135°; Contrast 0°; Contrast 45°; Contrast 90°; Contrast 135°; Energy 0°; Energy 45°; Energy 90°; Energy 135°)和仅基于小波变换(以各子带的能量 作为特征)的提取特征方法也进行了实验, 见表 4和表 5,分类器依然采用图 3所示的 支撑向量机结构。
从表 4, 表 5, 表 6可以看出, 利用小波 变换的多尺度分析特性,加之灰度共生矩阵 运用, 能够较全面的捕获图像中的纹理信息,
分类效果较好。 而只用灰度共生矩阵或只用小波能量作为特征的分类准确率都只能达到是 88.75%。 另 外,提出方法的测试样本分类准确率与训练样本分类准确率基本接近,这也表明本文算法有更好的推 广泛化能力。
最后,人群密度监控系统需要有一定的实时性,本文方法通过软件实现,一幅图像识别时间约为
图 3 分类器结构
表 2 最优方案的核函数
SVM1 SVM2SVM3 Svc kernel
rbf p =4 rbf p =4
poly p =4
表 4 本文方法测试结果
1(40)
2(40)
3(40)
4(40)
测试样本 准确率
训练样本 准确率
140 0 0 0
20 37 1 0
30 3 37 2 4
0 0 2 38
95% 96.5%
表 5 仅基于灰度共生矩阵的测试结果
1(40)
2(40)
3(40)
4(40)
测试样本
准确率
训练样本 准确率
134 1 4 0
23 38 3 0
33 1 32 2 40 0 1 38
88.75% 94.3%
22 电路与系统学报 第 12卷
0.194秒,其中灰度共生矩阵计算占据了主 要时间。考虑到在这么短的时间内人群密度 不会发生剧烈改变,此外本文方法的软件还 存在一定的优化空间,可以进一步提高判别 速度,所以能够满足实际应用需要。从表 7可以分析出,本文方法与仅基于灰度共生矩 阵的方法相比,在时间复杂度上相当,原因
在于小波变换和支撑向量机都花费很少的时间。本文方法在 未引入高计算复杂度的同时,提高了分类准确率。而与仅基 于小波的方法相比,以可接受的计算复杂换来了正确检测率 的大幅提高。因此,本文方法具备较好的实时性。
6 总结
本文实现了一种智能化人群密度估计算法。提出了一种基于小波变换与灰度共生矩阵的人群密度 特征描述策略。对 300幅图像的试验结果证明,该方法可达到 95%的正确识别率,基本能够满足智能 化人群密度监控的要求。 参考文献:
[1] Davie A C, Yin J H, Velastin S A. Crowd. Monitoring Using Image Processing [J]. Electronics & Communication Engineering Journal, 1995,
7(1): 37-47.
[2] Siu-Yang Cho, Tommy W S Chow, Chi-Tat Leung. A Neural-Based Crowd Estimation by Hybrid Global Learning Algorithm [J]. IEEE
Transaction on, 1999, 29(4): 535-541. [3] 陈武凡 . 小波分析及其在图像处理中的应用 [M]. 北京 : 科学出版社 , 2002. [4] 沈兰荪 , 卓力 , 等 . 视频编码与低速率传输 [M]. 北京 : 电子工业出版社 , 2001-12. [5] 阮秋琦 . 数字图像处理 [M]. 北京 : 电子工业出版社 , 2001-01. [6] 边肇祺 , 张学工 . 模式识别 [M]. 北京 : 清华大学出版社 , 2000.
[7]
A N Marana, L F Costa, R A Lotufo, S A Velastin. On the Efficacy of Texture Analysis for Crowd Monitoring [A]. Computer Graphics, Image Processing, and Vision, 1998. Proceedings. SIBGRAPI '98. International Symposium on [C]. 20-23 Oct. 1998.
作者简介 :胡波 (1981-) ,男,硕士研究生,主要研究方向为图像处理; 李晓华 (1973-) ,女,陕西韩城人,现为北
京工业大学讲师,博士,主要研究方向为压缩域图像处理,图像压缩,图像理解等; 沈兰荪 (1938-) ,男,江苏省苏 州市人, 1961年毕业于北京邮电学院通信工程系,现为北京工业大学教授、博士生导师,研究领域为图像编码、处理、 传输与应用,以及光谱信号的检测与处理等。
Estimation crowd density for surveillance
HU Bo, LI Xiao-hua, SHEN Lan-sun
( Signal and Information Processing Lab., Beijing University of Technology, Beijing 10002, China )
Abstract: Crowd density estimation is a very important issue in intelligentized crowd surveillance, which has quite important effect and significance for people. This paper proposes a novel crowd density estimation method, which first employs wavelet transform and grey level dependence matrix to extract the features, then uses the support vector machine to identify the level of the crowd density. According to the experiments, the results show that this method is efficient and feasible. Key words: crowd density estimation; wavelet analysis; grey level dependence matrix; support vector machine
表 7 实时性分析
每幅图像
平均用时 小波变换 部分用时 灰度共生矩 阵部分用时 分类部 分用时 约 0.194s
约 0.03s
约 0.16s
约 0.003s
表 6 仅基于小波变换的测试结果
1(40)
2(40)
3(40)
4(40)
测试样本 准确率
训练样本 准确率
138 4 3 0
20 33 2 1
31 2 33 1 4
1 1 2 38
88.75% 95.7%
范文五:视频监控中人群流量和密度估计算法分析
2009年第 33期 (总第 335期 )
电视技术
*上海市科委重点攻关项目 (08241203402)
文章编号 :1002-8692(2009) 11-0100-04
视频监控中人群流量和密度估计算法分析 *
苏
航 , 郑世宝 , 杨
华
(上海交通大学 图像通信与信息处理研究所 , 上海市数字媒体处理与传输重点实验室 , 上海 200240)
【 摘
要 】 对视频监控领域的群体分析技术进行了研究 , 包括基于像素统计和纹理分析方法的人群密度估计算法和基于分割和统
计回归的在景人数统计的算法 。 这些算法在不同的背景下各具优点 , 但在实际应用中仍存在许多缺陷 , 需要进行改良和提升 。 最 后 , 预测了对群体分析技术的发展趋势 。
【 关键词 】 群体分析 ; 人群密度分析 ; 在景人数统计 【 中图分类号 】 TN919.83
【 文献标识码 】 A
Survey of Crowd Flow and Density Estimation in Video Surveillance
SU Hang, ZHENG Shi-bao, YANG Hua
(Image Communication and Information Processing Institute, Shanghai Jiaotong University, Shanghai 200240, China )
【 Abstract 】 With the development of economy and the increasing of crowd activities, crowd analysis algorithm emerges prominently
due to the broad applications in surveillance. The crowd density estimation algorithm based on pixel statistics and texture analysis is investigated; and the pedestrians counting algorithm based on segmentation and statistics regression. The paper indicates both the strong point and defects of present algorithms.
Improvement and promotions of the algorithms are needed in future research work.
The developing trend of crowed analysis field is given in the last section.
【 Key words 】
crowd analysis; crowd density; pedestrians counting
·论文 ·
1
引言
近年来 , 视频监控及相关技术的迅速发展 , 为从视
频分析的角度进行人群的管理和监控奠定了基础 。 人群 的流量和密度是人群特性的 2个重要指标 , 也是群体管 理的重要依据 。 Polus [1]提出 , 人群密度与群体安全以及人 群所需求的服务等级密切相关 。 这一理论为之后人群密 度和群体安全之间关系的研究奠定了基础 。
近年来 , 随着计算机视觉和人工智能领域相关技术 的发展 , 基于智能视频分析的人群密度估计和流量统计 算法大量涌现 。 许多人群监控系统也相继在世界各地投 入使用 。 如 1995年 , 伦敦地铁最早采用了 EPSRC 人群监 控系统 [2], 用以统计地铁站中的人群密度和流量统计 , 预 防安全事故的发生 ; 2003年欧洲相继推出了 PRISMATI -CA [3]和 ADVISOR [4]系统 , 通过闭路电视系统 (CCTV ) 进行 人群流量统计 , 进而改善公共交通的管理 。 另一方面 , 由 于受到恐怖事件的威胁 , 一些国家和地区相继启动了 IS -
CAPS [5]
和 SERKET [6]
项目 , 进行基于视频分析的群体安全
问题研究 。 一个典型的智能化人群监控系统框图如图 1所示 。
2
人群密度分析算法
人群密度估计是指通过模式分类的相关方法对提
取到的人群密度特征进行分类 。 系统框图如图 2所示 。 通 常将人群密度分为极稀疏 、 稀疏 、 中等密度 、 拥挤和极度 拥挤 5个等级 [1]。
2.1人群密度特征提取
2.1.1
基于像素统计的人群特征提取
像素的统计特性是最早被采用的人群密度特征 , 也
是一种非常有效的特征参数 。 通常采用的人群像素特征 有 :
1) 全 局 特 征 :前 景 图 像 当 中 人 群 分 割 团 块 的 面 积 [2, 7]、 周长 、 方向角度和周长面积比 [8]等 。
2) 内部边缘特征 :边缘像素总量 、 边 缘 方 向 [9]以 及
VIDEO ENGINEERING
No. 11Vol.332009(Sum No. 335) Minkowski 维度 [10]等 。
这些特征在一定程度上反映了视频中人群的数量 以及遮挡关系 。 为了进一步增强这些特征的稳健性 , 可 以采用射影畸形矫正 [8]、 直方图统计 [11]等方法在分析之前 对特征进行预处理 。
2.1.2基于纹理分析的人群特征提取
由于像素特征对高密度人群的错误分类概率比较
大 , 1998年 , Marana [12-13]指出由于高密度人群在图像纹理 上体现出细模式 , 而低密度人群在图像纹理上体现出粗 模式 , 进而可以用灰度共生矩阵 [14]、 小波包分解 [13, 15]等纹 理分析的方法提取人群特征 。
纹理分析的方法可在一定程度上解决重叠所带来的 高密度人群错误分类 , 但是其复杂度较高 , 低密度人群 的错误分类概率比较大 。 在采用神经网络模型分析的情 况下 , 像素统计特征和纹理分析特征的比较如表 1所示 。
2.2密度特征分析算法
在提取了人群的密度特征后 , 需要进一步对密度特
征进行分析以获得人群的密度等级 。 最初的人群密度监 控系统 [17-19]都是简单地通过前景图像在整个图像当中所 占的比例来估算人群的密度 。 但在人群密度较大的情况 下 , 算法的错误分类概率迅速升高 。
1999年 , W. S. Chow [7]利用经过训练的神经网络来分 析人群特征 , 极大地提高了人群分析的准确性 , 该方法 已于 2002年在香港地铁系统中得到运用 。 随着机器学 习的发展 , Chow
[20]
和 Marana [12]分别利用分类性和自学
习 性 能 更 佳 的 RBF 神 经 网 络 , 自 组 织 映 射 神 经 网 络 (SOM ) 实 现 人 群 密 度 分 析 。 近 年 来 随 着 支 持 向 量 机 (SVM ) 理论的逐步完善 , 其优良的性能已经被越来越多 地应用到人群密度的分析当中 [16]。 在采用人群像素统计特 征的情况下 , 密度特征分析算法性能的比较如表 2所示 。
3
人群人数统计算法
3.1
基于人体分割的人数统计
分割是人数统计最直观的方法 , 它通过利用视频或
图像当中的形状 、 颜色和运动信息来实现人的分割和识 别 , 进而达到人数统计的目的 。
一方面 , 人的分割和识别可以通过动态信息获得 。
Sidenbladh [21]利用人体运动的光流信息 , Gonzalez
[22]
利用
了 KLT 特征 , Bradsk 和 Davisal [23]利用运动梯度信息实现 人体分割 。 基于运动信息的个体分割误差比较大 , 尤其 是在群体规模比较大 , 遮挡现象比较严重的区域 , 个体 运动信息的提取更加困难 。 另一方面 , 个体分割也可通 过人体的外观颜色和形状等静态信息获得 , 例如 Meer [24]和 Nevatia
[25]
通过对个体外观的颜色直方图 , Gavrila 和
Krahnstoever [26-27]
利用形状实现个体分割 , 进而达到人数
统计的目的 。 但形状的表征同样是一个比较困难的问题 。
对于大规模群体而言 , 针对个体的分割非常困难 。 相 比 较 而 言 , 人 群 团 块 (group ) 的 分 割 来 说 较 简 单 。
Maryland 大学的 Hydra 系统 [28]对 W4[29-30]系统进行了拓展 和改进 , 通过对多人团块进行头顶点的检测达到人数统 计的目的 。 该系统在很多场景下是非常有效的 , 但缺乏 对团块分裂和合并的处理策略 , 在系统图像分辨率比较 低时很容易发生头顶点检测的误判 。
Chen [31]借鉴了 Hybra 系统的思想 , 在多人团块检测 的基础上 , 增加了跟踪模块 , 并在此基础之上完成对团 块合并和分裂的识别 , 对团块内部头顶点的误判也可以 通过对团块的历史记录来进行修正 。 其系统框架可以作 为典型的基于多人团块的人数统计系统的参考 , 框图如 图 3所示 。
但 Chen 的算法仍然基于团块内头顶点的检测 , 在 人群密度较高时误差较大 。 Kilambi 将团块作为一个整体 处理 , 对每个团块估算其所包含个体数目的上界和下
表 1
人群特征提取算法比较分析
比较项
优势 劣势 典型差错概率 代表系统
像素统计 特性
计算复杂度
低 , 适用于低 密度群体特征
提取 无法处理重叠问 题 , 高密度人群错 误分类率高 低密度 :9.2%高密度 :14.8%
Chow
[7]
纹理特征 可以解决高密
度人群中个体
重叠问题
计算复杂度比较 高 , 低密度人群错 误分类概率比较大
低密度 :28.8%高密度 :6.7%
Marana [14]Wu [16]
表 2
密度特征分析算法的比较分析
优势
劣势
典型差错概率 代表系统
支持 向量机
小样本 ; 全 局最优 ; 泛 化能力强
复杂度随样本数 量增多迅速提高
低密度 :7.8%高密度 :11.8%
Wu [16]
线性 拟合
神经 网络
复杂度低 样本充分情 况下性能接 近最优 错误分类概率高
结构复杂 ; 容易陷 入局部极值 ; 易出 现过学习问题 低密度 :25%高密度 :38%低密度 :9.2%高密度 :14.8%Davies [2]Murino [18]Tesei [19]Chow [7]Marana [14]
101
2009年第 33期 (总第 335期 )
电视技术
界 , 通过最小化代价函数求得在景人数 , 在降低系统复 杂度的同时 , 也提高了系统的准确性 。
3.2基于统计回归的人数统计算法
早期的 Davies [2]
系统通过线性分析前景像素比例 、 边
缘像素比例和在景人数的比例关系进行统计 。 该方法简 单易行 , 但误差率依然会随着人数的增多而显著增大 。
近年来 , 部分学者开始尝试采用统计回归方式进行 人数统计 。 Chan [8]将人群的流量近似为一个高斯过程 , 综 合利用人群的像素和纹理信息 , 建立回归方程如下
k (x p , x q ) =α1(x t
p x q +1) +α2exp
-||x p -x q ||2
3
+α4δ(p , q )
对式中的参数进行了估计 , 得到了在景人数和人群特征 的函数关系 。 式中第一项代表了一个总体趋势 , 即主要 由像素信息决定 ; 第二项代表了非线性关系 , 主要由纹 理信息决定 ; 第三项代表了观测噪声项 。
3.3人数统计算法分析
人数统计算法的性能比较分析如表 3所示 。 总体来
说 , 由于人体姿态 、 摄像机的视角 、 光照条件和背景条件 的影响 , 分割问题变得非常复杂 。 但是对于监控区域较 小或者人群密度较低的地区 , 分割的方法仍然具有很重 要的意义 ; 而基于统计回归的人群人数统计算法 , 不拘
泥于人的个体特征 , 而提取整个人群的群体特征 , 通过 构建群体特征和在景人数的函数关系的方法来实现人 群的密度估计 , 更适合进行大规模人群的统计 。
4发展趋势分析
表 4对一些具有代表性的人群分析系统进行了 比 较分析 。 需要说明的是 , 因为这些系统应用在不同的场 景当中 , 其性能的量化分析仅可作为比较的参考 , 但其 所提供的思想方法反映了人数统计和人群密度估计的 发展 。
表 3
人数统计算法的比较分析
优势
劣势 典型差错概率 代表系统
统计 回归 复杂度低 , 适用 于大规模群体人
数统计
需要根据不 同条件改变 回归参数
在场景固定的情
况下 , 准确性达到
90%以上
Chan [8]Wu [16]
个体 分割
多人团 块分割
算法直观 , 适应 性强 , 小规模人
群准确 复杂程度适中 ; 适应性强 ; 低密 度情况准确性高 复杂程度高 , 不适合大规 模群体统计
不适合大规 模群体人数
统计 低密度 :25.7%高密度 :38.9%
中等密度情况下 :室内 :5.3%室外 :11.4%Meer [26]Nevatia [27]Chen [33]Kilambi [31]主要作者
人群特征 提取 特征预处理
人群密度分析 在景人数分析 应用场景 最低差错率 系统性能分析 Davies [2]前景像素 信息 -线性拟合 线性拟合
伦敦地铁 低密度 :25.7%高密度 :38.9%复杂度比较低
高密度人群差错率较大 Chow [7]前景像素 边缘像素 -多层感知器神经网络 -香港地铁 低密度 :9.2%高密度 :14.8%监控范围较小 , 分类器结构比较
复杂 , 样本需求量大 Marana [14]灰度共生 矩阵 -自组织映射神经网络 -利物浦地铁
低密度 :28.8%高密度 :6.7%低密度人群错误分类概率比较大 Kong [11]前景像素 信息
直方图统计
线性分析神经网络 线性回归
-密度分析 :4.5%人数统计 :11.8%利用直方图对特征进行处理 ,
具有更好的稳健性 Wu [16]灰度共生
矩阵 射影畸形矫正
支持向量机分类
SVM 回归 -密度分析 :8.7%人数统计 :12.4%射影畸形矫正利用 SVM
改进分类性能 Chen [31]Kilambi 运动团块 分割
--多人团块分割 -室内环境 :5.3%室外环境 :11.4%系统复杂度比较高 , 很难进行实时处理 Chan [8]
像素特征
纹理特征
射影畸形矫正
-
统计回归
-
固定场景下准确率达
到 90%以上
场景及摄像机改变时需调整
参数 , 适应性不强
表 4
人群密度分析和人数统典型系统比较分析
总体来说 , 本文算法无论是准确度和复杂度方面来 说都需要进行改进 , 今后需对以下几个方面进行探索 :
1) 现有的基于像素统计的人群特征和纹理的人 群特征在描述精度和复杂度方面都有局限性 , 针对大规 模的群体 , 还需要进一步探索更加高效准确的特征描述 方式 , 从而能够克服射影畸形 、 摄像机角度变换等因素 带来的影响 。
2) 现在被广泛使用的支持向量机的理论仍然存
在 SVM 的计算量较大 , 参数不容易调整的问题因素 。 针 对人群分析的实际 , 综合考虑复杂度和精度 , 采用合理
的人群密度分析算法将是一个重要研究方向 。
3) 在人数统计方面 , 统计回归的方法因其从人群
的整体特征出发 , 在大规模人群的人数统计方面开始受 到关注 。 但如何根据不同的场景和条件 , 考虑射影畸形 等多种因素的影响 , 选用合适的统计回归模型仍然有大 量亟待解决的问题 。 参考文献 :
[1]SCHOFER J , USHPIZ A , POLUS A. Pedestrian flow and level of
service[J].Journal of Transportation Engineering , 1983, 109(1):
VIDEO ENGINEERING
No. 11Vol.332009(Sum No. 335) 46-56.
[2]DAVIES S A , JIA Hongyin , VELASTIN S A. Crowd monitoring
using image processing[J].Electronics &Communication Engineer -ing Journal , 1995, 7(1):37-47.
[3]VELASTIN S A , KHOUDOUR L L , SUN B P L , et al. PRIS -MATICA :
a multi-sensor surveillance system for public transport
networks [EB/OL].[2009-05-20].http://d.wanfangdata.com.cn/NSTL-HY_NSTL_HY17074105.aspx.
[4]吴彤峰 , 李春新 , 过磊 . 基于 ADVISOR 的混合动力微型客车驱动
系统结构类型选择 [EB/OL].[2009-05-20].http://d.wanfangdata.com.
cn/Periodical_hfgydxxb200611004.aspx.
[5]Integrated surveillance of crowded areas for public security[EB/OL].
[2009-05-20].http://www.iscaps.reading.ac.uk/.
[6]INRIA, Towards active security for public places[EB/OL].[2009-05-20].http://www.itea2.org/public/project_leaflets/SERKET_profile_oct-05.pdf. [7]
CHO Siu-yeung ,
CHOW T W S ,
LEUNG Chi-tat.
A neural
based crowd estimation by hybrid global learning algorithm[EB/OL].[2009-05-20].http ://d.wanfangdata.com.cn/NSTLQK_NSTL_QK18313957.aspx.
[8]CHAN A B , LIANG Z S J , VASCONCELOS N. Privacy preserv -ing crowd monitoring :
Counting people without people models or
tracking [EB/OL].[2009-05-20].http ://ieeexplore.ieee.org/xpl/free-abs_all.jsp?arnumber=4587569.[9]
CANNY J.
A computational approach to edge detection[EB/OL].
[2009-05-20].http ://portal.acm.org/citation.cfm?id=11275.
[10]LOTUFO R A , MARANA A N , COSTA L F , et al. Estimating
crowd density with minkoski fractal dimension[EB/OL].[2009-05-20].http://www.ece.umassd.edu/Faculty/acosta/ICASSP/Icassp_1999/PDF/AUTHOR/IC991678.PDF.
[11]GRAY D , KONG D , TAO H. Counting pedestrians in crowds
using viewpoint invariant training [EB/OL].[2009-05-20].http://www.citeulike.org/user/handee/article/5630049.
[12]MARANA A N , FONTOURA D , LOTOFO R A , et al. Estimat -ing crowd density with Minkowski fractal dimension [EB/OL].[2009-05-20].http://www.citeulike.org/user/etidey/article/4517691.[13]MARANA A N , VELASTIN S A , COSTA L F , et al. Automatic
estimation of crowd density using texture [J].SafetyScience , 1998, 28(3):165-175. [14]
VERONA V V,
MARANA A N.
Wavelet packet analysis for
crowd density estimation[C]//Proc.the IASTED International Sym -posia on Applied Informatics. Innsbruck , Austria :Acta Press , 2001:535-540.
[15]LIU S , CHEN J , CHAO H. Estimation of number of people in
crowded scenes using perspective transformation [J].IEEETrans. Systems ,
Man and Cybernetics ,
Part A :Systems and Humans ,
2001, 31(6):645_654.
[16]WU Xin-yu , LIANG Guo-yuan , LEE K K , et al. Crowd density
estimation using texture analysis and learning [EB/OL].[2009-05-20].http://ieeexplore.ieee.org/xpl/freeabs_all.jsp?arnumber=4141867.[17]DAVIES A C, YIN J H, VELASTIN S A. Crowd monitoring us -
ing image processing[J].Electronicsand Communication Engineer -ing Journal, 1995,7(1):37-47. [18]
DAVIES A C , YIN Jiahong , VELASTIN S A. A real-time vi -sion system for crowding monitoring [EB/OL].[2009-05-20].http://ieeexplore.ieee.org/xpl/freeabs_all.jsp?tp=&arnumber=376792.[19]REGAZZONI C S , TESEI A.
Distributed data fusion for real-time crowding estimation [EB/OL].[2009-05-20].http://www.ingen-taconnect.com/content/els/01651684/1996/00000053/00000001/art00075.
[20]HUANG D , TOMMY W S , CHOW A. People-counting system
using a Hybrid RBF neural network[J].NeuralProcessing Letters , 2003, 18:97-113. [21]
BLACH M J ,
SIDENBLADH H.
Learning image statistics for
Bayesian tracking[EB/OL].[2009-05-20].http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.61.3065.
[22]GONZALEZ J J , LIM I S , FUA P , et al. Robust tracking and
segmentation of human motion in an image sequence [EB/OL].[2009-05-20].http ://citeseerx.ist.psu.edu/viewdoc/summary?doi=
10.1.1.14.623.
[23]BOBICK A , DAVIS J W. The representation and recognition of
action using temporal templates [EB/OL].[2009-05-20].http://cite-seerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.55.5459.
[24]MEER P , COMANICIU D , RAMESH V. Kernel based object
tracking [J].IEEETrans. Pattern Analysis and Machine Intelli -gence , 2003, 25(5):564-575.
[25]
NEVATIA R ,
ZHAO T.
Tracking multiple humans in crowded
environments [EB/OL].[2009-05-20].http://ieeexplore.ieee.org/xpl/freeabs_all.jsp?arnumber=1315192.
[26]GAVRILA D M , PHILOMIN V. Real-time object detection for
smart vehicles [EB/OL].[2009-05-20].http://ieeexplore.ieee.org/xpl/freeabs_all.jsp?arnumber=791202.
[27]RITTSCHER J , TU P H , KRAHNSTOEVER N , et al. Simultane -ous estimation of segmentation and shape [EB/OL].[2009-05-20].http ://ieeexplore.ieee.org/xpls/abs_all.jsp?arnumber=1467481.[28]HARITAOGLU I , HARWOOD D , DAVIS L S. Hydra :multiple
people detection and tracking using silhouettes[J].IEEEInterna -tional Workshop on Visual Surveillance , 1999, 6:6-13. [29]HARITAOGLU I , HARWOOD D , DAVIS L S. W4:real-time
surveillance of people and their activities[J].IEEETransactions on
Pattern Analysis and Machine Intelligence , 2000, 22(8):809-830. [30]
RAHMALAN H , NIXON M S , CARTER J N. On crowd densi -ty estimation for surveillance [EB/OL].[2009-05-20].http://ieeex-plore.ieee.org/xpl/freeabs_all.jsp?arnumber=4123816.
[31]ZHANG Enwei , CHEN Feng. A fast and robust people counting
method in video surveillance [EB/OL].[2009-05-20].http://ieeex-plore.ieee.org/xpl/freeabs_all.jsp?arnumber=4415360.笕
作者简介 :
苏
航 (1985-), 硕士生 , 主研计算机视觉 , 模式识别 , 智能视频监控 ; 郑世宝 (1959-), 教授 , 博士生导师 , 研究方向为数字电视 、 网络多 媒体技术和城市公共安全监控系统 。 责任编辑 :任健男
收稿日期 :2009-08-27
103
转载请注明出处范文大全网 » 复杂场景中的自动人群密度估计