[发明专利]音视频融合的人员入侵检测方法无效
申请号: | 201210455136.2 | 申请日: | 2012-11-13 |
公开(公告)号: | CN102982634A | 公开(公告)日: | 2013-03-20 |
发明(设计)人: | 张重阳;王德富;郑世宝 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G08B13/00 | 分类号: | G08B13/00;G06K9/00;G10L15/14 |
代理公司: | 上海汉声知识产权代理有限公司 31236 | 代理人: | 郭国中 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 融合 人员 入侵 检测 方法 | ||
1.一种音视频融合的人员入侵检测方法,其特征在于,所述方法包括如下步骤:
步骤一,基于HOG通过检测区域收缩法进行快速人体识别;
步骤二,根据步骤一识别出的人体目标,基于MFCC使用高斯混合模型分类器进行实时脚步识别;
步骤三,基于贝叶斯网络的音视频融合决策。
2.根据权利要求1所述的音视频融合的人员入侵检测方法,其特征是,所述步骤一分为两小步:
第一步,提取时空检测区域:使用自适应高斯混合模型GMM进行前景提取,在时域上采用间隔检测策略IDS,把图像在宽度上分成K部分计算每个子区间的前景像素数量占整个前景的比例R,计算出来的子区间的值大于阈值即被选为检测区域,对于上述得到的检测区域做不平衡扩展UBD和重叠消除OVE;
第二步,在最终得到的区域上做基于HOG特征提取和人体识别检测。
3.根据权利要求2所述的音视频融合的人员入侵检测方法,其特征是,所述的使用自适应高斯混合模型进行前景提取,具体为:在前景目标出现的时候进行检测,假设前景目标出现当Rfg>Tfg,其中Rfg=Pixfg/Pixtotal,Pixfg和Pixtotal分别代表前景图像和整个图像的像素数量,Tfg是Pixfg/Pixtotal的比例阈值。
4.根据权利要求2所述的音视频融合的人员入侵检测方法,其特征是,所述的间隔检测策略,具体为:把图像在宽度上分成K个子区间,第k个子区间记作Bk,k的取值从1到K,Vk=Pixk/Pixfg,Pixk代表第k个子区间的前景像素数量,当Vk>Tb时,Bk被选为检测区域。
5.根据权利要求2所述的音视频融合的人员入侵检测方法,其特征是,所述的不平衡扩展,具体为:如果Vk-1>Vk+1,检测区域向左扩展η个子区间宽度,向右扩展1-η个子区间宽度,其中η>0.5,反之亦然,扩展后的区域被作为检测区域;这里Vk=Pixk/Pixfg,Pixk代表第k个子区间的前景像素数量,Pixfg代表前景图像的像素数量,故Vk-1表示第k-1个子区间前景像素占整个前景图像像素的比例,Vk+1表示第k+1个子区间前景像素占整个前景图像像素的比例。
6.根据权利要求2所述的音视频融合的人员入侵检测方法,其特征是,所述的重叠消除,具体为:当从前景像素比例中得到的两个检测区域是相邻的,在不平衡扩展之后得到的检测区域就会存在很多的重叠部分,选择R值最大的那个扩展区域为检测区域,另一个丢弃。
7.根据权利要求1-6任一项所述的音视频融合的人员入侵检测方法,其特征是,所述步骤二,具体为:将音频信号分成固定长度为Wa的重叠时间窗口,Wa小于0.2S,将结果做些修正,若之前1s内有至少2次是脚步声,则当前段若被检测为非脚步声更正为脚步声。
8.根据权利要求1-6任一项所述的音视频融合的人员入侵检测方法,其特征是,所述的步骤三,具体为:最后的检测结果E,视频报警和音频报警作为中间层,底层特征为脚步声识别F、基于HOG的快速人体识别H和前景像素比例R。
9.根据权利要求8所述的基于贝叶斯网络的音视频融合决策,其特征是,底层特征为脚步声识别F、基于HOG的快速人体识别H和前景像素比例R,视频报警V和音频报警A作为中间层,最后的输出是人员入侵事件的检测结果I,表示为:
运用贝叶斯链式法则,得到
这里ai、vk、im分别表示A、V、I所取的具体数值,该公式表示,在推理模型使用前,每个节点的先验知识都可以从实验开始前的初始化运行期间或者其它独立的实验中得到。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210455136.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:低排放发电厂
- 下一篇:一种燃气管道在役焊接行为的结构分析方法