[发明专利]一种多目标检测方法有效
申请号: | 201910881579.X | 申请日: | 2019-09-18 |
公开(公告)号: | CN110610210B | 公开(公告)日: | 2022-03-25 |
发明(设计)人: | 吕乔;叶茂;窦强;李鑫鹏 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06V10/774;G06V10/764;G06N3/04;G06N3/08 |
代理公司: | 成都虹盛汇泉专利代理有限公司 51268 | 代理人: | 王伟 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 多目标 检测 方法 | ||
1.一种多目标检测方法,其特征在于,包括以下步骤:
S1、从摄像头获取实时图像,从实时图像中提取基本特征图,同时将实时图像输入上下文综合网络,得到上下文特征图;
S2、将实时图像输入卷积激活网络,抓取实时图像中的模糊激活区域;为每幅实时图像创建对应的定位缓存池,用于存放该实时图像的所有模糊激活区域的坐标信息,以模糊激活区域的坐标信息作为第一批定位信息;
S3、令循环次数n=1;
S4、以第n批定位信息的坐标对为中心,在基本特征图上获取该中心位置附近固定面积的局部特征矩阵,对局部特征矩阵进行滤波和池化处理,得到聚焦特征;
S5、将聚焦特征和上下文特征输入双层循环卷积发射模块,输出两个预测值:第一预测值为该特征属于相应类别的置信度;第二预测值为输入该双层循环卷积发射模块的第n+1批定位信息,并将此批定位信息输入到定位缓存池,该定位缓存池是全局维护的,每一次循环体结束后都要向定位缓存池中注入当次循环体输出的定位信息;
S6、令n=n+1,返回步骤S4,直到达到预设的循环次数;最后输出所有定位信息,以及两个误差值:第一误差值为定位附近预测类别与标签类别的误差,第二误差值为定位信息与标签目标框坐标的误差;
S7、将定位缓存池中的所有定位信息输入区域建议网络,其中,首先输出固定数量的第一建议候选框集合,以及两个误差值:第一误差值是第一建议候选框坐标与目标框真实坐标的误差,第二误差是第一建议候选框预测类别与目标框真实类别的误差;
将第一建议候选框输入建议-目标模块,对第一建议候选框集合进行筛选和精修,输出第二建议候选框、每个第二建议候选框的对应类别标签、以及每个第二建议候选框的坐标与对应标签坐标的偏移;
将第二建议候选框输入Faster RCNN方法中ROIpooling模块,经过池化操作输出一致大小的最终兴趣特征;将最终兴趣特征输入Faster RCNN方法中RCNN模块,分别得到对于最终兴趣特征对应候选框内的预测类别、预测框坐标,并产生两个误差值:第一误差是预测类别与标签类别的误差,第二误差是预测框坐标与标签坐标的误差;
S8、循环步骤S1到S7,对S1到S7求出的所有误差求和,进行反向传播算法,迭代更新网络中的各项权重参数。
2.根据权利要求1所述的一种多目标检测方法,其特征在于,所述上下文综合网络由基本的卷积操作单元叠加而成,其中单个卷积操作单元公式的表达如下:
其中,l表示第l层卷积层;j代表当前卷积层的第j个特征图;表示第l-1层卷基层的第j个特征图;表示第l层卷基层第j个特征图的第m个卷积核;Mj表示第j个特征图对应的所有卷积核集合;*号代表卷积运算;表示第l层卷基层第j个特征图的偏置向量参数;f(·)代表激活函数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910881579.X/1.html,转载请声明来源钻瓜专利网。