[发明专利]一种利用ReCNN融合上下文信息的行人检测方法有效
申请号: | 201710670156.4 | 申请日: | 2017-08-07 |
公开(公告)号: | CN107563299B | 公开(公告)日: | 2021-06-15 |
发明(设计)人: | 李涛;李冬梅;赵雪专;裴利沈;朱晓珺;赵俊彬;汪伟;邹香玲;郭航宇 | 申请(专利权)人: | 郑州信息科技职业学院 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32;G06N3/08 |
代理公司: | 郑州联科专利事务所(普通合伙) 41104 | 代理人: | 刘建芳 |
地址: | 450000 河南省郑*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 利用 recnn 融合 上下文 信息 行人 检测 方法 | ||
1.一种利用ReCNN融合上下文信息的行人检测方法,其特征在于,包括以下步骤:
步骤A:提取输入图像中包含上下文信息的特征;
所述的步骤A包括以下步骤:
步骤A1:定义监控视频图像总共包含N帧图像,第t帧图像表示为I(t),其中, t=1,2…,N;
步骤A2:利用一个截断的卷积神经网络提取I(t-2)、I(t-1)和I(t)连续三帧输入图像的三个特征图组,分别表示为X(t-2)、X(t-1)和X(t),其中,
X(t)={x1(t),x2(t),…,xM(t)},
其中,M表示特征图的数量;
步骤B:利用ReCNN对输入图像中的行人位置进行预测,获取预测行人位置的掩码图,具体的:
利用ReCNN融合步骤A2中所述的连续三帧输入图像I(t-2)、I(t-1)和I(t)的三个特征图组X(t-2)、X(t-1)和X(t),输出一张预测行人位置的掩码图y:
其中,表示递归卷积核,Wif表示前向卷积核,和Wif的大小均为3×3,表示卷积操作,b表示偏移量,函数f(x)采用sigmoid激活函数;
步骤C:确定输入图像中行人的位置;
步骤D:训练融合上下文信息的ReCNN网络的参数。
2.根据权利要求1所述的一种利用ReCNN融合上下文信息的行人检测方法,其特征在于,所述的步骤C包括以下步骤:
步骤C1:按比例将掩码图y放大,直至掩码图y的尺寸与输入图像的尺寸相同;
步骤C2:根据视频输入图像中不同行人的尺寸,设置多个大小与行人尺寸对应的行人位置检测框;
步骤C3:在掩码图y上以遍历的方式滑动行人位置检测框,若检测框中所有元素值之和小于检测框面积的60%,那么判断此区域的行人位置检测框中不包含行人,行人位置检测框滑动到下一位置继续检测;反之,则判断此位置的行人位置检测框中包含行人;
步骤C4:所有尺寸的行人位置检测框在掩码图y上滑动后,使用非最大抑制算法合并相交的检测框,其中,当大检测框覆盖小检测框时,保留大检测框。
3.根据权利要求1所述的一种利用ReCNN融合上下文信息的行人检测方法,其特征在于,所述的步骤D包括以下步骤:
步骤D1:确定训练集;
步骤D2:确定目标函数;
步骤D3:训练融合上下文信息的递归卷积神经网络的参数。
4.根据权利要求3所述的一种利用ReCNN融合上下文信息的行人检测方法,其特征在于,所述的步骤D3包括以下步骤:
步骤D31:计算掩码图对于目标函数的梯度;
步骤D32:计算递归卷积核关于目标函数的梯度;
步骤D33:计算前向卷积核Wif关于目标函数的梯度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州信息科技职业学院,未经郑州信息科技职业学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710670156.4/1.html,转载请声明来源钻瓜专利网。