[发明专利]一种基于关键区域检测的复杂目标精准识别方法有效
申请号: | 201810345899.9 | 申请日: | 2018-04-18 |
公开(公告)号: | CN108537286B | 公开(公告)日: | 2020-11-24 |
发明(设计)人: | 王田;李玮匡;李嘉锟;陶飞 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04 |
代理公司: | 北京科迪生专利代理有限责任公司 11251 | 代理人: | 杨学明;卢纪 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 关键 区域 检测 复杂 目标 精准 识别 方法 | ||
1.一种基于关键区域检测的复杂目标精准识别方法,其特征在于,包括如下步骤:
步骤1,读取数据库中训练样本中的复杂目标图片、复杂目标图片对应的关键区域的坐标标签、以及复杂目标图片对应的分类标签,使用交叉训练的方法对复杂目标精准识别网络进行融合训练;
步骤2,将待识别的复杂目标图片作为步骤1训练之后的复杂目标精准识别网络的输入,通过VGG卷积神经网络提取特征,得到待识别的复杂目标图片的特征图;
步骤3,将步骤2得到的特征图输入到关键区域检测子网络中,以3×3大小的子网络在特征图上进行滑动,以锚方框作为参考,检测复杂目标图片的关键区域,给出关键区域的预测方框和是否是关键区域的可能性Pis,Pnot;
步骤4,采用非最大抑制对检测到的重叠度较高的区域进行过滤,当不同预测方框交集部分面积与并集部分面积的比例超过规定的阈值IOU_threshold时,则仅保留是关键区域可能性Pis最大的预测方框,而对其他的方框进行过滤;
步骤5,设定是关键区域可能性Pis的阈值P_threshold,将是关键区域可能性Pis大于设定阈值P_threshold的区域映射到VGG网络提取的特征图上;
步骤6,将步骤5得到的映射到特征图上的区域进行区域标准池化,把检测出的不同大小的区域池化为固定大小的特征图;
步骤7、将步骤6得到的固定大小的特征图作为分类子网络的输入,使用分类子网络对其作精准的分类,使用softmax函数对分类结果归一化,得到对关键区域分类的概率;
步骤8,针对同一张图片对应的一个复杂目标,对步骤7得到的各个关键区域的分类的对应概率取均值进行融合,得到复杂目标种类的精准识别结果。
2.根据权利要求1所述的一种基于关键区域检测的复杂目标精准识别方法,其特征在于:所述步骤1中,交叉训练过程如下:
步骤11,使用以ImageNet数据库图片为训练样本、针对分类任务训练的VGG网络的权值作为初始权值,在此基础上进行微调;
步骤12,读取复杂目标图片和复杂目标图片对应的关键区域的坐标标签,对关键区域检测子网络进行训练,训练的损失函数为loss=LP+Lreg,其中LP为关键区域检测子网络输出的是否是关键区域的概率Pis,Pnot与标签真实值的交叉熵,Lreg为关键区域检测子网络输出的检测区域坐标偏移量与标签中实际关键区域坐标偏移量的平方和;
步骤13,读取复杂目标图片和复杂目标图片对应的分类标签,对分类子网络进行训练,训练的损失函数为网络输出分类结果与实际标签结果之间的交叉熵;
步骤14重复步骤12和步骤13若干次,对关键区域检测子网络和分类子网络进行交叉训练,直到网络稳定。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810345899.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种面向数据流的全在线聚类方法
- 下一篇:基于图模型的图像闭环检测方法及装置