[发明专利]目标识别方法及装置在审
申请号: | 202010235904.8 | 申请日: | 2020-03-30 |
公开(公告)号: | CN113468908A | 公开(公告)日: | 2021-10-01 |
发明(设计)人: | 蔚勇 | 申请(专利权)人: | 北京四维图新科技股份有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32;G06K9/62 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 徐静;臧建明 |
地址: | 100094 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标 识别 方法 装置 | ||
本申请提供一种目标识别方法及装置,该方法,包括:获取待识别图像或待识别视频;通过预设的目标检测网络模型对待识别图像或待识别视频,进行目标对象的识别,得到识别结果,目标检测网络模型的网络结构包括骨干网络、指导锚生成网络GA‑RPN、RoI Align和BBoxHead,其中,骨干网络的输出分别与GA‑RPN的输入以及RoI Align的输入连接,GA‑RPN的输出与RoI Align的输入连接,RoI Align的输出与BBoxHead的输入连接,提高了对目标图像识别的准确率和召回率。
技术领域
本申请涉及图像识别技术领域,尤其涉及一种目标识别方法及装置。
背景技术
目标检测一直是图像处理领域的热点,尤其针对小目标的高鲁棒性、高准确性以及高实时性的检测,具有重要的应用价值。例如,对道路中标识牌的识别,一方面,要求小目标的检测识别可靠性很高,尤其对于较远距离的小目标需要有较高的检测准确率和召回率;另一方面对于图像信息的处理时间要尽可能短,以保证很高的实时性。
现有技术中,通常采用基于深度学习的目标检测方法,基于深度学习的目标检测可表示为:图像的深度特征提取、基于深度神经网络的目标识别与定位,现有技术中通过基于深度神经网络对小目标进行检测的目标检测模型,通常采用基于Cascade_RCNN的网络结构,图1是现有技术中基于Cascade_RCNN的网络结构的示意图,如图1所示,基于Cascade_RCNN的网络结构包括骨干网络(back bone)、锚生成网络(Region Proposals NetworksHead,RPN)、RoI Align以及BBox Head,其中,待识别图像或待识别视频输入至back bone,得到待识别图像或待识别视频的特征图(feature map),然后经过RPN生成候选框(proposals),RoI Align根据proposals和feature maps,计算proposals对应的featuremaps区域,最后,BBox Head对feature maps区域,分别做分类(classification)和定位(localization)处理,得到目标的类别和坐标,实现了对目标的检测。
然而,现有技术中,使用现有的Cascade_RCNN目标检测模型对小目标进行检测时,检测的准确率和召回率较低。
发明内容
本申请提供一种目标识别方法及装置,以实现对目标对象的识别,提高了对目标图像识别的准确率和召回率。
第一方面,本申请实施例提供一种目标识别方法,包括:
获取待识别图像或待识别视频;
通过预设的目标检测网络模型对待识别图像或待识别视频,进行目标对象的识别,得到识别结果,目标检测网络模型的网络结构包括骨干网络、指导锚生成网络(GuidedAnchoring Region Proposals Networks Head,GA-RPN)、感兴趣区域对齐(region ofinterest Align,RoI Align)和BBoxHead,其中,骨干网络的输出分别与GA-RPN的输入以及RoI Align的输入连接,GA-RPN的输出与RoI Align的输入连接,RoI Align的输出与BBoxHead的输入连接。
本申请实施例中,通过预设的目标检测网络模型,对待识别图像或待识别视频进行目标对象的识别,实现了对目标对象的识别,并且,目标检测网络模型的网络结构,与现有技术中的Cascade_RCNN的网络结构比较,通过GA-RPN替代现有Cascade_RCNN的网络结构中RPN,GA_RPN根据目标中心点距离信息生成锚,使得目标区域有更多的锚去涵盖小目标,提高了对目标图像识别的准确率和召回率。
在一种可能的实施方式中,识别结果包括目标对象的坐标和类别,在得到识别结果之后,还包括:
根据目标对象的坐标,确定目标对象在真实世界场景中的位置;
存储目标对象的位置和类别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京四维图新科技股份有限公司,未经北京四维图新科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010235904.8/2.html,转载请声明来源钻瓜专利网。