[发明专利]一种利用ReCNN融合上下文信息的行人检测方法有效

专利信息
申请号: 201710670156.4 申请日: 2017-08-07
公开(公告)号: CN107563299B 公开(公告)日: 2021-06-15
发明(设计)人: 李涛;李冬梅;赵雪专;裴利沈;朱晓珺;赵俊彬;汪伟;邹香玲;郭航宇 申请(专利权)人: 郑州信息科技职业学院
主分类号: G06K9/00 分类号: G06K9/00;G06K9/32;G06N3/08
代理公司: 郑州联科专利事务所(普通合伙) 41104 代理人: 刘建芳
地址: 450000 河南省郑*** 国省代码: 河南;41
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 利用 recnn 融合 上下文 信息 行人 检测 方法
【权利要求书】:

1.一种利用ReCNN融合上下文信息的行人检测方法,其特征在于,包括以下步骤:

步骤A:提取输入图像中包含上下文信息的特征;

所述的步骤A包括以下步骤:

步骤A1:定义监控视频图像总共包含N帧图像,第t帧图像表示为I(t),其中, t=1,2…,N;

步骤A2:利用一个截断的卷积神经网络提取I(t-2)、I(t-1)和I(t)连续三帧输入图像的三个特征图组,分别表示为X(t-2)、X(t-1)和X(t),其中,

X(t)={x1(t),x2(t),…,xM(t)},

其中,M表示特征图的数量;

步骤B:利用ReCNN对输入图像中的行人位置进行预测,获取预测行人位置的掩码图,具体的:

利用ReCNN融合步骤A2中所述的连续三帧输入图像I(t-2)、I(t-1)和I(t)的三个特征图组X(t-2)、X(t-1)和X(t),输出一张预测行人位置的掩码图y:

其中,表示递归卷积核,Wif表示前向卷积核,和Wif的大小均为3×3,表示卷积操作,b表示偏移量,函数f(x)采用sigmoid激活函数;

步骤C:确定输入图像中行人的位置;

步骤D:训练融合上下文信息的ReCNN网络的参数。

2.根据权利要求1所述的一种利用ReCNN融合上下文信息的行人检测方法,其特征在于,所述的步骤C包括以下步骤:

步骤C1:按比例将掩码图y放大,直至掩码图y的尺寸与输入图像的尺寸相同;

步骤C2:根据视频输入图像中不同行人的尺寸,设置多个大小与行人尺寸对应的行人位置检测框;

步骤C3:在掩码图y上以遍历的方式滑动行人位置检测框,若检测框中所有元素值之和小于检测框面积的60%,那么判断此区域的行人位置检测框中不包含行人,行人位置检测框滑动到下一位置继续检测;反之,则判断此位置的行人位置检测框中包含行人;

步骤C4:所有尺寸的行人位置检测框在掩码图y上滑动后,使用非最大抑制算法合并相交的检测框,其中,当大检测框覆盖小检测框时,保留大检测框。

3.根据权利要求1所述的一种利用ReCNN融合上下文信息的行人检测方法,其特征在于,所述的步骤D包括以下步骤:

步骤D1:确定训练集;

步骤D2:确定目标函数;

步骤D3:训练融合上下文信息的递归卷积神经网络的参数。

4.根据权利要求3所述的一种利用ReCNN融合上下文信息的行人检测方法,其特征在于,所述的步骤D3包括以下步骤:

步骤D31:计算掩码图对于目标函数的梯度;

步骤D32:计算递归卷积核关于目标函数的梯度;

步骤D33:计算前向卷积核Wif关于目标函数的梯度。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州信息科技职业学院,未经郑州信息科技职业学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710670156.4/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top