[发明专利]一种基于深度学习的全天候视频监控方法有效
申请号: | 201410557880.2 | 申请日: | 2014-10-20 |
公开(公告)号: | CN104320617B | 公开(公告)日: | 2017-09-01 |
发明(设计)人: | 黄凯奇;康运锋;曹黎俊;张旭 | 申请(专利权)人: | 中国科学院自动化研究所 |
主分类号: | H04N7/18 | 分类号: | H04N7/18;G06T7/00 |
代理公司: | 中科专利商标代理有限责任公司11021 | 代理人: | 宋焰琴 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 全天候 视频 监控 方法 | ||
技术领域
本发明属于模式识别技术领域,特别涉及一种基于深度学习的全天候视频监控方法,尤其适用于大流量人群状态的分析。
背景技术
目前我国城市化水平已超过50%,大量流动人口的涌入使城市人口的密度越来越大,大规模人群活动变得日益频繁,由于人流拥挤踩踏而发生重大事故的现象屡见不鲜。因此,如何对人群进行监控管理,在群体性事件发生的初期进行主动识别和及时预警,成为当前各个国家视频监控领域的研究热点之一。为了更好地对群体性异常事件进行识别和预警,从而减少灾难的发生,实时对人群规模变化的掌握是一个关键的因素。基于智能视频监控的人群分析,是对特定监控场景内的运动物进行行为分析,可以对其行为规律作出描述,从而实现利用机器智能进行异常事件自动检测,还可以学习建立相关行为模型,为公共空间设计、智能环境等提供参考。然而,由于监控场景的不同、摄像机安装角度的差异、天气以及日照强度的变化,使得智能监控系统在全天候监控时,发挥作用甚小。
卷积神经网络,作为一种深度学习方法,是为二维图像处理而特别设计的一个多层感知器。它具有一些传统技术所没有的优点:良好的容错能力、并行处理能力和自学能力,可处理环境信息复制,背景知识不清楚,推理规则不明确情况下的问题,允许有较大的缺损、畸变,运行速度快,自适应性能好,具有较高的分辨能力。因此,卷积神经网络,可以解决全天候监控中的问题,可以保证智能监控系统在各种情况下的较高的稳定的准确率。
发明内容
本发明的目的是提供一种基于深度学习的全天候视频监控方法,可以全天候的分析视频中人群状态,尤其是人群的数量。
为了实现上述目的,本发明提出的一种基于深度学习的全天候视频监控方法包括以下步骤:
步骤1,实时采集视频流,基于得到的视频流通过线采样获得多幅原始采样图样本,以及速度采样图样本;
步骤2,对于得到的速度采样图样本进行时空矫正;
步骤3,基于原始采样图和速度采样图,离线训练得到深度学习模型,所述深度学习模型包括分类模型和统计模型;
步骤4,利用所述步骤3得到的深度学习模型对于实时视频流进行人群状态分析。
本发明与目前国内外最新方法相比具有几个明显的优点:1)对不同环境、光照强度、天气情况以及摄像头角度的不同设置,均具有良好的适应性;2)对大流量人群涌出等人群拥挤环境,可以保证较高的准确率;3) 计算量小,可以满足实时视频处理的要求。
附图说明
图1是本发明基于深度学习的全天候视频监控方法的流程图;
图2是本发明几何校正的示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。
本发明的思想要点是:1)人进出门(或虚拟门)行为,可以通过固定位置采样将动态行为转换成静态图片,以方便人群的分析;2)通过透视矫正以及速度矫正,使得该方法在不同摄像头角度设置下保证较高的准确率;3)深度学习模型有助于自动发现最有效的特征,并通过串联多特征保证人群状态分析的准确率在不同场景下的稳定性。下面对于本发明中所涉及到的技术细节予以说明。
本发明基于深度学习的全天候视频监控方法的流程图如图1所示,如图1所示,所述基于深度学习的全天候视频监控方法包括以下步骤:
步骤1,实时采集视频流,基于得到的视频流通过线采样获得多幅原始采样图样本,以及速度采样图样本;
在本发明一实施例中,为了统计的方便,首先,对于所述视频流中的每帧图像,在行人进出门的位置处,设置一个宽度固定为n像素(在本发明一实施例中,n=3)、长度覆盖整个门的标定线ln,作为人进出的虚拟门界限,其中,所述标定线的位置根据视频场景中需要统计人数的位置而定,其可以是任意角度,优选为与门的长度方向垂直,比如,如果门正对着摄像头,则标定线可设置为横向放置,如果门与摄像头的拍摄方向垂直,则标定线可设置为纵向放置;然后,提取所述视频流中每隔f(在本发明一实施例中,f=2)帧的图像F中所述标定线覆盖的像素,由于标定线的宽度是n像素,因此每完成一次采样,就会得到n行的像素数据,经过固定时间间隔t(在本发明一实施例中,t=300帧),采样得到的所有像素累积组成原始采样图像I,进而对于视频流可以得到多幅原始采样图样本。在本发明一实施例中,按照时间采样的顺序,将采样得到的每行图像像素数据,由上到下按行填充,得到原始采样图像I。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410557880.2/2.html,转载请声明来源钻瓜专利网。