[发明专利]用于生成图像识别模型的方法和装置有效

申请号：	201910790984.0	申请日：	2019-08-26
公开（公告）号：	CN110516737B	公开（公告）日：	2023-05-26
发明（设计）人：	徐麟;孙瀚;陈志远	申请（专利权）人：	南京人工智能高等研究院有限公司
主分类号：	G06V10/774	分类号：	G06V10/774;G06V10/75;G06V10/77
代理公司：	北京思源智汇知识产权代理有限公司 11657	代理人：	毛丽琴
地址：	210046 江苏省南京市栖霞区***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	用于生成图像识别模型方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本公开实施例公开了一种用于生成图像识别模型的方法和装置，其中，该方法包括：针对样本图像集合中的每个样本图像，通过初始模型确定每个样本图像的特征数据，其中，样本图像集合包括多个子集合，每个子集合对应一个图像类别；基于每个样本图像的特征数据，确定每个图像类别的平均特征数据；基于每个样本图像的特征数据和每个图像类别的平均特征数据，更新初始模型的参数；若初始模型的参数满足预设条件，将更新后的初始模型确定为图像识别模型。本公开实施例可以降低样本对的采样复杂度，提高了模型的训练效率，有助于挖掘难样本对，从而提高了生成的图像识别模型的识别准确性。

技术领域

本公开涉及计算机技术领域，尤其是一种用于生成图像识别模型的方法和装置、用于识别图像的方法和装置、计算机可读存储介质及电子设备。

背景技术

学习数据的语义嵌入度量，缩小数据类内差异(或距离)，使相似的同类样本聚集在一起；扩大数据类间差异(或距离)，使不相似的异类样本分开是物体识别任务的重要基石。随着深度学习技术的迅速发展，深度度量学习近年来越来越受到重视。通过端到端地训练深度神经网络，可以学习到复杂的高度非线性的数据深度特征表示(从输入空间到低维语义嵌入度量空间)。深度度量学习到的深度特征表示和语义嵌入度量在视觉识别中有广泛的应用场景和优异的识别性能，例如，2D自然图像检索/分类、人脸识别、3D物体检索/分类、多源异构视觉感知数据跨模态检索(如2D图像/视频、3D物体、文本数据之间的检索匹配)等。为了提高图像识别模型的识别准确性，需要从众多的训练样本中挖掘难样本(即距离较近的异类样本及距离较远的同类样本)，从而使训练的模型能够更准确地提取图像的特征。

发明内容

本公开的实施例提供了一种用于生成图像识别模型的方法和装置、用于识别图像的方法和装置、计算机可读存储介质及电子设备。

本公开的实施例提供了一种用于生成图像识别模型的方法，该方法包括：针对样本图像集合中的每个样本图像，通过初始模型确定每个样本图像的特征数据，其中，样本图像集合包括多个子集合，每个子集合对应一个图像类别；基于每个样本图像的特征数据，确定每个图像类别的平均特征数据；基于每个样本图像的特征数据和每个图像类别的平均特征数据，更新初始模型的参数；若初始模型的参数满足预设条件，将更新后的初始模型确定为图像识别模型。

根据本公开实施例的另一个方面，提供了一种用于识别图像的方法，包括：获取目标图像和待匹配图像集合；将目标图像和待匹配图像集合中的待匹配图像分别输入预先训练的图像识别模型，得到待识别图像的特征数据和待匹配图像的特征数据，其中，图像识别模型是基于上述第一方面中任一实施例的方法训练得到的；基于所得到的特征数据，确定目标图像分别与待匹配图像集合中的图像的相似度；将符合预设条件的相似度对应的待匹配图像，确定为与目标图像匹配的图像。

根据本公开实施例的另一个方面，提供了一种用于生成图像识别模型的装置，该装置包括：第一确定模块，用于针对样本图像集合中的每个样本图像，通过初始模型确定每个样本图像的特征数据，其中，样本图像集合包括多个子集合，每个子集合对应一个图像类别；第二确定模块，用于基于每个样本图像的特征数据，确定每个图像类别的平均特征数据；更新模块，用于基于每个样本图像的特征数据和每个图像类别的平均特征数据，更新初始模型的参数；第三确定模块，用于若初始模型的参数满足预设条件，将更新后的初始模型确定为图像识别模型。

根据本公开实施例的另一个方面，提供了一种用于识别图像的装置，包括：获取模块，用于获取目标图像和待匹配图像集合；识别模块，用于将目标图像和待匹配图像集合中的待匹配图像分别输入预先训练的图像识别模型，得到待识别图像的特征数据和待匹配图像的特征数据，其中，图像识别模型是基于上述第一方面中任一实施例描述的方法训练得到的；第四确定模块，用于基于所得到的特征数据，确定目标图像分别与待匹配图像集合中的图像的相似度；第五确定模块，用于将符合预设条件的相似度对应的待匹配图像，确定为与目标图像匹配的图像。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于南京人工智能高等研究院有限公司，未经南京人工智能高等研究院有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201910790984.0/2.html，转载请声明来源钻瓜专利网。

上一篇：多维可视化的多源异构数据多层DRNN深度融合方法
下一篇：一种分布式比对聚类方法、装置、电子设备及存储介质

同类专利

专利分类

G 物理

G06 计算；推算；计数

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]用于生成图像识别模型的方法和装置有效

专利文献下载