[发明专利]一种图像定位方法、装置、设备及存储介质有效
申请号: | 202010064090.6 | 申请日: | 2020-01-20 |
公开(公告)号: | CN110874591B | 公开(公告)日: | 2020-07-28 |
发明(设计)人: | 张超;胡浩;利啟东;黄聿;黄深能 | 申请(专利权)人: | 广东博智林机器人有限公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/32;G06K9/62;G06T7/73 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 528000 广东省佛山市顺德区北滘镇顺江*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图像 定位 方法 装置 设备 存储 介质 | ||
1.一种图像定位方法,其特征在于,包括:
获取目标全局图像和目标局部图像;
分别将所述目标全局图像和所述目标局部图像输入预先训练好的目标图像定位模型,得到所述目标局部图像在所述目标全局图像中的对应位置;其中,所述目标图像定位模型包括特征提取模型,所述特征提取模型由基于全局图像样本集合预训练得到的目标自编码网络模型确定,所述特征提取模型用于提取所述目标全局图像的全局图像特征和所述目标局部图像的局部图像特征;
其中,在分别将所述目标全局图像和所述目标局部图像输入预先训练好的目标图像定位模型之前,还包括:
基于所述全局图像样本集合和预设第一损失函数,训练得到所述目标自编码网络模型;
提取所述目标自编码网络模型中的编码网络,并将所述编码网络作为所述特征提取模型;
所述目标图像定位模型还包括卷积网络,其中,所述卷积网络的输入为所述特征提取模型的输出,所述卷积网络用于将所述特征提取模型输出的多维特征矩阵转换为二维特征矩阵;
在分别将所述目标全局图像和所述目标局部图像输入预先训练好的目标图像定位模型之前,还包括:
利用全局图像样本集合、局部图像样本集合、每个图像样本对所对应的预设位置标签和预设第二损失函数,训练得到所述目标图像定位模型;其中,所述图像样本对包括全局图像样本和与所述全局图像样本对应的局部图像样本,所述预设位置标签用于表示局部图像样本在全局图像样本中的对应位置,所述目标图像定位模型还包括差值运算模块,所述差值运算模块的输入为所述卷积网络的输出,所述差值运算模块的输出为所述目标局部图像在所述目标全局图像中的对应位置,所述预设第二损失函数用于确定所述差值运算模块的输出与所述预设位置标签之间的第二损失函数值。
2.根据权利要求1所述的方法,其特征在于,在得到所述目标局部图像在所述目标全局图像中的对应位置之后,还包括:
确定所述目标局部图像与所述对应位置处的原始局部图像之间的差异。
3.根据权利要求1所述的方法,其特征在于,在基于所述全局图像样本集合和预设第一损失函数,训练得到所述目标自编码网络模型之前,还包括:
确定每个全局图像样本的最大外接矩形;
利用所述最大外接矩形确定每个全局图像的感兴趣区域,并将每个感兴趣区域作为所述全局图像样本集合。
4.根据权利要求1所述的方法,其特征在于,在利用全局图像样本集合、局部图像样本集合、每个图像样本对所对应的预设位置标签和预设第二损失函数,训练得到所述目标图像定位模型之前,还包括:
根据预设位置标签确定规则,确定所述预设位置标签。
5.根据权利要求4所述的方法,其特征在于,根据预设位置标签确定规则,确定所述预设位置标签,包括:
根据预设降采样倍数,将每个全局图像样本网格化,得到每个全局图像样本对应的网格图像,其中,所述预设降采样倍数与所述特征提取模型的降采样倍数相同;
将每个所述网格图像中的第一网格赋值为第一数值,将每个所述网格图像中除第一网格之外的其他网格赋值为第二数值,将赋值后的网格图像作为预设位置标签;其中,所述第一网格为第一位置对应的网格,所述第一位置为局部图像样本在对应的全局图像样本中的对应位置。
6.根据权利要求4或5所述的方法,其特征在于,利用全局图像样本集合、局部图像样本集合、每个图像样本对所对应的预设位置标签和预设第二损失函数,训练得到所述目标图像定位模型,包括:
针对每个图像样本对,执行如下操作:分别将全局图像样本和局部图像样本输入预先建立的第一图像定位模型中,得到第一相对位置特征图,所述第一相对位置特征图为在所述差值运算模块中,局部图像样本对应的局部图像样本特征对相应的全局图像样本对应的全局图像样本特征进行遍历做差运算得到的;
基于所述第一相对位置特征图、所述图像样本对所对应的预设位置标签和第二损失函数,对所述第一图像定位模型的模型参数进行调整,得到所述目标图像定位模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东博智林机器人有限公司,未经广东博智林机器人有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010064090.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种本地警报信号扩散方法和系统
- 下一篇:一种家装板材运输用包装机器人
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序