[发明专利]通过提高目标分类和定位准确度改善目标检测性能的方法在审
申请号: | 201710450327.2 | 申请日: | 2017-06-15 |
公开(公告)号: | CN107316058A | 公开(公告)日: | 2017-11-03 |
发明(设计)人: | 娄英欣;周芸;付光涛;姜竹青;门爱东 | 申请(专利权)人: | 国家新闻出版广电总局广播科学研究院;北京邮电大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/46;G06N3/04 |
代理公司: | 天津盛理知识产权代理有限公司12209 | 代理人: | 王利文 |
地址: | 100886 北京市西*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 通过 提高 目标 分类 定位 准确度 改善 检测 性能 方法 | ||
1.一种通过提高目标分类和定位准确度改善目标检测性能的方法,其特征在于包括以下步骤:
步骤1、根据卷积神经网络架构提取图像特征,并选择卷积层前M层输出进行特征融合,形成多特征的特征图;
步骤2、在卷积层M上进行网格划分,在每个网络中预测固定数目和大小的目标候选框;
步骤3、将候选框映射到特征图上进行裁剪,然后将裁剪结果进行多特征连接;
步骤4、将上述结果通过全连接层后,通过Softmax分类算法对图像特征进行分类,并用重叠面积损失函数进行在线迭代回归定位,得到最终目标检测的结果。
2.根据权利要求1所述的通过提高目标分类和定位准确度改善目标检测性能的方法,其特征在于:所述步骤1的具体方法包括以下步骤:
⑴首先将带有物体真实包围框的图片输入到卷积神经网络架构中,通过Caffe提取图像通过卷积神经网络不同层的特征;
⑵将靠前的卷积层输出的图像特征进行最大池化操作,并将卷积层M输出的图像特征进行反卷积操作,实现输出的尺寸都与中间卷积层的输出特征大小一致;
⑶最后将所有卷积层输出的特征进行融合,得到图像的多特征提取的特征图。
3.根据权利要求1所述的通过提高目标分类和定位准确度改善目标检测性能的方法,其特征在于:所述步骤2的实现方法包括以下步骤:
⑴在卷积层M输出的特征图上进行6*6的网格划分;
⑵在每个单个的网络小格正中间预测4个可能包含物体的候选框,这4个候选框具有固定的大小和长宽比,长宽比分别为1:1、1:2和2:1,仅对于1:1长宽比的候选框,设定2种候选框大小0.6和0.9;
⑶在网络训练的过程中,我们将物体的真实包围框和候选框进行匹配,通过二者的IOU重叠面积大于等于0.7进行筛选,并删除掉超出图像边界的候选框;
⑷最后在卷积层M的特征图上生成了100个候选框。
4.根据权利要求1所述的通过提高目标分类和定位准确度改善目标检测性能的方法,其特征在于:所述步骤3的实现方法包括以下步骤:
⑴根据卷积层M的特征图上生成的100个候选框,根据其所在位置映射相应的多层特征图上,并在多层特征图上进行相应的裁剪;
⑵将裁剪后的特征图方块做1*1卷积,然后对卷积结果分别进行3*3卷积和5*5卷积;
⑶为了获取全文信息,将多层特征图经过最大池化层,然后经过1*1卷积层和激活层;
⑷将1*1卷积、3*3卷积、5*5卷积和全文信息的卷积输出结果按照前后顺序进行连接,形成候选框的多特征连接。
5.根据权利要求1所述的通过提高目标分类和定位的准确度改善目标检测性能,其特征在于:所述步骤4的具体实现方法包括以下步骤:
⑴通过全连接层后,通过Softmax分类算法对图像特征进行分类,基于目标检测的数据集,每类物体具有自己相应的精度;
⑵通过重叠面积损失函数对候选框进行回归定位,使得候选框更加靠近物体的真实包围框,该损失函数为候选框和真实包围框的交集面积除以并集面积;
⑶根据Softmax损失和重叠面积损失值进行排序,在线筛选出正样本和负样本的比例为3:1,更新样本库输入到多层特征图上继续进行迭代回归定位;
⑷迭代N次后,候选框更加靠近物体的真实包围框,模型训练好之后可以进行实际物体的测试。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家新闻出版广电总局广播科学研究院;北京邮电大学,未经国家新闻出版广电总局广播科学研究院;北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710450327.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:核动力装置故障诊断方法
- 下一篇:学习者姿态识别方法