[发明专利]一种多目标检测方法有效
申请号: | 201910881579.X | 申请日: | 2019-09-18 |
公开(公告)号: | CN110610210B | 公开(公告)日: | 2022-03-25 |
发明(设计)人: | 吕乔;叶茂;窦强;李鑫鹏 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06V10/774;G06V10/764;G06N3/04;G06N3/08 |
代理公司: | 成都虹盛汇泉专利代理有限公司 51268 | 代理人: | 王伟 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种多目标检测方法,包括以下步骤:S1、提取基本特征图和上下文特征图;S2、抓取实时图像中的模糊激活区域,以模糊激活区域的坐标信息作为第一批定位信息;S3、令循环次数n=1;S4、以第n批定位信息的坐标对为中心,在基本特征图上获取该中心位置附近固定面积的局部特征矩阵;S5、将聚焦特征和上下文特征输入双层循环卷积发射模块;S6、令n=n+1,返回步骤S4,直到达到预设的循环次数;输出所有定位信息;S7、将所有定位信息输入区域建议网络;S8、循环步骤S1到S7,对所有误差求和。本发明能通过预先定义的双层循环卷积发射模块输出定位信息,从而获取到图像中目标物体的大致位置,大幅度减少对每个特征点进行的计算量。 | ||
搜索关键词: | 一种 多目标 检测 方法 | ||
【主权项】:
1.一种多目标检测方法,其特征在于,包括以下步骤:/nS1、从摄像头获取实时图像,从实时图像中提取基本特征图,同时将实时图像输入上下文综合网络,得到上下文特征图;/nS2、将实时图像输入卷积激活网络,抓取实时图像中的模糊激活区域;为每幅实时图像创建对应的定位缓存池,用于存放该实时图像的所有激活区域的坐标信息,以模糊激活区域的坐标信息作为第一批定位信息;/nS3、令循环次数n=1;/nS4、以第n批定位信息的坐标对为中心,在基本特征图上获取该中心位置附近固定面积的局部特征矩阵,对局部特征矩阵进行滤波和池化处理,得到聚焦特征;/nS5、将聚焦特征和上下文特征输入双层循环卷积发射模块,输出两个预测值:第一预测值为该特征属于相应类别的置信度;第二预测值为输入该双层循环卷积发射模块的第i+1批定位信息,并将此批定位信息输入到定位缓存池,该定位缓存池是全局维护的,每一次循环体结束后都要向定位缓存池中注入当次循环体输出的定位信息;/nS6、令n=n+1,返回步骤S4,直到达到预设的循环次数;最后输出所有定位信息,以及两个误差值:第一误差值为定位附近预测类别与标签类别的误差,第二误差值为定位信息与标签目标框坐标的误差;/nS7、将定位缓存池中的所有定位信息输入区域建议网络,其中,首先输出固定数量的第一建议候选框集合,以及两个误差值:第一误差值是第一建议候选框坐标与目标框真实坐标的误差,第二误差是第一建议候选框预测类别与目标框真实类别的误差;/n将第一建议候选框输入建议-目标模块,对第一建议候选框集合进行筛选和精修,输出第二建议候选框、每个第二建议候选框的对应类别标签、以及每个第二建议候选框的坐标与对应标签坐标的偏移;/n将第二建议候选框输入Faster RCNN方法中ROI pooling模块,经过池化操作输出一致大小的最终兴趣特征;将最终兴趣特征输入Faster RCNN方法中RCNN模块,分别得到对于最终兴趣特征对应候选框内的预测类别、预测框坐标,并产生两个误差值:第一误差是预测类别与标签类别的误差,第二误差是预测框坐标与标签坐标的误差;/nS8、循环步骤S1到S7,对所有误差求和,进行反向传播算法,迭代更新网络中的各项权重参数。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910881579.X/,转载请声明来源钻瓜专利网。