[发明专利]图像定位方法、装置、系统和存储介质有效
申请号: | 201711243514.X | 申请日: | 2017-11-30 |
公开(公告)号: | CN108876847B | 公开(公告)日: | 2021-04-27 |
发明(设计)人: | 程大治;张祥雨 | 申请(专利权)人: | 北京旷视科技有限公司 |
主分类号: | G06T7/70 | 分类号: | G06T7/70;G06T5/00;G06N3/04;G06N3/08 |
代理公司: | 北京市磐华律师事务所 11336 | 代理人: | 高伟;卜璐璐 |
地址: | 100190 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 定位 方法 装置 系统 存储 介质 | ||
本发明提供了一种图像定位方法、装置、系统和存储介质,所述图像定位方法包括:获取待处理图像;以及利用训练好的生成对抗网络对所述待处理图像进行图像定位。根据本发明实施例的图像定位方法、装置、系统和存储介质利用训练好的生成对抗网络进行图像定位,能够有效解决图像定位受图像多峰性质影响的问题,从而提高图像定位的精度。
技术领域
本发明涉及图像识别技术领域,更具体地涉及一种图像定位方法、装置、系统和存储介质。
背景技术
图像定位一直是计算机视觉领域重要且备受关注的技术,其目标是给定一张图,通过算法给出图中某一个物体相对整张图片的位置信息。当下进行图像定位的主流技术包括最小化欧氏距离以及使用更快速区域卷积神经网络(Faster-RCNN)框架。
然而,前述的技术受图片本身多峰问题的影响,导致当图片中含有大小相近、重叠区域较小或没有的两个或多个物体时,算法输出的结果无法与其中任何一张图较好匹配。原因在于当给定一张这样的图时,图像包围盒的真实分布存在多个尖峰,而如果最小化欧氏距离,则相当于使用极大似然估计用一个高斯分布拟合真实分布,导致拟合出的高斯分布的单峰在真实分布的多个峰之间。与之类似,基于FasterRCNN的方法也存在受多峰影响的问题,该问题是图像定位技术当下的主要瓶颈之一。
因此,需要提供新的图像定位方法来解决上述问题。
发明内容
本发明提出了一种关于图像定位的方案,其利用训练好的生成对抗网络进行图像定位,能够有效解决图像定位受图像多峰性质影响的问题。下面简要描述本发明提出的关于图像定位的方案,更多细节将在后续结合附图在具体实施方式中加以描述。
根据本发明一方面,提供了一种图像定位方法,所述图像定位方法包括:获取待处理图像;以及利用训练好的生成对抗网络对所述待处理图像进行图像定位。
在本发明的一个实施例中,所述利用训练好的生成对抗网络对所述待处理图像进行图像定位包括:基于输入的所述待处理图像和噪声,利用所述训练好的生成对抗网络的生成器得到生成包围盒,以作为所述图像定位的结果。
在本发明的一个实施例中,所述图像定位方法还包括:计算所述生成包围盒与真实包围盒的交并比,所述真实包围盒为与所述待处理图像相对应的真实包围盒;以及如果所述交并比大于或等于预设阈值,则记作定位准确,反之则记作定位失败。
在本发明的一个实施例中,所述图像定位方法还包括:计算所述图像定位的准确率。
在本发明的一个实施例中,所述生成对抗网络包括生成器、映射管道和判别器,其中:所述生成器接收输入的图像和噪声,输出生成包围盒;所述映射管道将输入的包围盒映射为包围盒热点图;以及所述判别器判断输入的包围盒热点图是真实包围盒热点图还是生成包围盒热点图。
在本发明的一个实施例中,所述生成器包括卷积层、池化层、加载预训练权重的残差单元、加载随机权重的残差单元、全局池化层以及多输出全连接层。
在本发明的一个实施例中,所述判别器包括卷积层、池化层、加载预训练权重的残差单元、加载随机权重的残差单元、全局池化层以及单输出全连接层。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京旷视科技有限公司,未经北京旷视科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711243514.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于光变曲线的卫星本体尺寸计算方法
- 下一篇:追踪系统及其追踪方法
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序