[发明专利]目标检测方法、设备及介质有效
申请号: | 201810501013.5 | 申请日: | 2018-05-23 |
公开(公告)号: | CN108764235B | 公开(公告)日: | 2021-06-29 |
发明(设计)人: | 程志;隋运峰;刘宝树;黄忠涛;赵士瑄;冯家琪;孟令同 | 申请(专利权)人: | 中国民用航空总局第二研究所 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06N3/04 |
代理公司: | 北京酷爱智慧知识产权代理有限公司 11514 | 代理人: | 安娜 |
地址: | 610041 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标 检测 方法 设备 介质 | ||
本发明提供一种神经网络模型、目标检测方法、设备及介质,其中,神经网络模型,包括:特征生成层,用于获取待检测图像对应的特征图的集合,形成特征数据集;分类评分层,用于基于特征数据集,确定对应至少一个分类类别的得分数据集,其中,得分数据集中包含至少一个得分图,一个得分图对应一个分类类别;区域描述层,用于基于得分数据集,确定至少一个分类类别的候选目标区域及对应的区域描述特征;结果生成层,用于基于至少一个分类类别的候选目标区域及对应的区域描述特征,确定至少一个目标的目标结果信息。
技术领域
本发明涉及图像识别和深度学习技术领域,尤其涉及一种神经网络模型、目标检测方法、设备及介质。
背景技术
目前,基于深度学习的神经网络模型是用于对图像进行目标检测的主流技术。为了获取更好的性能,神经网络模型本身也需要不断地优化和改进。当前,用于对图像进行目标检测的神经网络模型,大多属于两步式模型,其中,第一步为,生成检测目标预选框(即,疑似目标区域),第二步为,对预选框内图像进行识别,实现目标识别和目标定位。但是,两步式模型的缺陷为,由于对图像进行目标检测时,需要分步进行,检测效率较低。
发明内容
本发明要解决的技术问题是提供一种神经网络模型、目标检测方法、设备及介质,同时进行目标区域计算和目标区域识别,且可同时识别至少一个分类类别的目标,可在保持识别率前提下降低计算复杂度。
为解决上述技术问题,本发明提供的技术方案如下:
第一方面,本发明实施例提供了一种神经网络模型,用于对图像进行目标检测,模型包括:
特征生成层,用于获取待检测图像对应的特征图的集合,形成特征数据集;
分类评分层,用于基于特征数据集,确定对应至少一个分类类别的得分数据集,其中,得分数据集中包含至少一个得分图,一个得分图对应一个分类类别;
区域描述层,用于基于得分数据集,确定至少一个分类类别的候选目标区域及对应的区域描述特征;
结果生成层,用于基于至少一个分类类别的候选目标区域及对应的区域描述特征,确定至少一个目标的目标结果信息。
进一步地,目标结果信息包括:
目标所在区域、目标对应的分类类别、检测结果可信度。
进一步地,特征生成层,用于:
获取待检测图像;
根据预设的缩放比例序列对待检测图像进行尺度变换,获取至少一个尺度缩放图像;
针对每个尺度缩放图像,进行卷积处理,并获取至少一个神经元对应输出的初始特征图;
针对每个神经元,对相应神经元输出的各初始特征图进行尺度反变换,以获取与待检测图像的尺度相同的至少一个中间特征图,形成中间数据集;
针对相应神经元的中间数据集中每个像素坐标点,将特征维度的最大像素值,确定为最终特征图在相应像素坐标点的像素值,将产生最大像素值对应的相应神经元的感受野半径,确定为感受野图在相应像素坐标点的像素值,形成最终特征图和感受野图;
将至少一个神经元对应的最终特征图和感受野图合并,形成特征数据集。
进一步地,分类评分层,用于:
针对特征数据集中每个像素坐标点,基于相应像素坐标点在特征维度的各特征值,计算相应像素坐标点对各分类类别的识别得分值;
针对每个分类类别,将对应相应分类类别的识别得分值合并,形成相应分类类别的得分图;
将各分类类别的得分图合并,形成得分数据集。
进一步地,区域描述层,用于:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国民用航空总局第二研究所,未经中国民用航空总局第二研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810501013.5/2.html,转载请声明来源钻瓜专利网。