[发明专利]用于训练图像识别模型的方法和装置在审

申请号：	202011057689.3	申请日：	2020-09-30
公开（公告）号：	CN112036509A	公开（公告）日：	2020-12-04
发明（设计）人：	赵艳梅	申请（专利权）人：	北京百度网讯科技有限公司
主分类号：	G06K9/62	分类号：	G06K9/62;G06N3/04;G06N3/08;G06N20/20
代理公司：	北京英赛嘉华知识产权代理有限责任公司 11204	代理人：	王达佐;马晓亚
地址：	100085 北京市***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	用于训练图像识别模型方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请公开了用于训练图像识别模型的方法和装置，涉及人工智能技术领域，具体为深度学习和图像处理技术领域。该方法包括：从训练图像集中获取当前训练图像，以及获取模型类型不同的、已预先训练过的多个初始图像识别模型；基于采用多个初始图像识别模型分别对当前训练图像进行识别得到的多个预测识别标签，确定当前训练图像的实际识别标签；采用每个预测识别标签和实际识别标签，分别构建每个初始图像识别模型的损失函数；采用每个初始图像识别模型的损失函数，分别训练损失函数所对应的初始图像识别模型，得到训练完成的多个目标图像识别模型。采用本方法可以提高识别图像的准确度。

技术领域

本公开涉及计算机技术领域，具体涉及人工智能技术领域，具体为深度学习和图像处理技术领域，尤其涉及用于训练图像识别模型的方法和装置。

背景技术

图像是一种重要的信息载体，对图像进行细粒度的识别可以获取到更精准的图像信息。现有的图片识别方法在对图片进行粗粒度识别时具有较好的识别效果，然而，在对图片进行细粒度识别时，存在识别不准确的问题。

发明内容

提供了一种用于训练图像识别模型的方法、装置、电子设备以及计算机可读存储介质。

根据第一方面，提供了一种用于训练图像识别模型的方法，该方法包括：从训练图像集中获取当前训练图像，以及获取模型类型不同的、已预先训练过的多个初始图像识别模型；基于采用多个初始图像识别模型分别对当前训练图像进行识别得到的多个预测识别标签，确定当前训练图像的实际识别标签；采用每个预测识别标签和实际识别标签，分别构建每个初始图像识别模型的损失函数；采用每个初始图像识别模型的损失函数，分别训练损失函数所对应的初始图像识别模型，得到训练完成的多个目标图像识别模型。

根据第二方面，提供了一种用于识别图像的方法，该方法包括：获取待识别图像；获取多个目标图像识别模型，其中，多个目标图像识别模型基于以下步骤确定：采用每个预测识别标签和实际识别标签，分别构建每个初始图像识别模型的损失函数；采用每个初始图像识别模型的损失函数，分别训练损失函数所对应的初始图像识别模型，得到训练完成的多个目标图像识别模型；其中，多个预测识别标签基于模型类型不同的、已预先训练过的多个初始图像识别模型对从训练图像集中获取的当前训练图像进行识别得到；实际识别标签基于多个预测识别标签得到；利用多个目标图像识别模型确定待识别图像的标签。

根据第三方面，提供了一种用于训练图像识别模型的装置，该装置包括：第一获取单元，被配置为从训练图像集中获取当前训练图像，以及获取模型类型不同的、已预先训练过的多个初始图像识别模型；第一确定单元，被配置为基于采用多个初始图像识别模型分别对当前训练图像进行识别得到的多个预测识别标签，确定当前训练图像的实际识别标签；反馈单元，被配置为采用每个预测识别标签和实际识别标签，分别构建每个初始图像识别模型的损失函数；训练单元，被配置为采用每个初始图像识别模型的损失函数，分别训练损失函数所对应的初始图像识别模型，得到训练完成的多个目标图像识别模型。

根据第四方面，提供了一种用于识别图像的装置，该装置包括：第二获取单元，被配置为获取待识别图像；第三获取单元，被配置为获取多个目标图像识别模型，其中，多个目标图像识别模型基于以下步骤确定：采用每个预测识别标签和实际识别标签，分别构建每个初始图像识别模型的损失函数；采用每个初始图像识别模型的损失函数，分别训练损失函数所对应的初始图像识别模型，得到训练完成的多个目标图像识别模型；其中，多个预测识别标签基于模型类型不同的、已预先训练过的多个初始图像识别模型对从训练图像集中获取的当前训练图像进行识别得到；实际识别标签基于多个预测识别标签得到；第二确定单元，被配置为利用多个目标图像识别模型确定待识别图像的标签。

根据第五方面，本公开的实施例提供了一种电子设备，包括：一个或多个处理器：存储装置，用于存储一个或多个程序，当一个或多个程序被一个或多个处理器执行，使得一个或多个处理器实现如第一方面提供的用于训练图像识别模型的方法、或者实现如第二方面提供的用于识别图像的方法。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司，未经北京百度网讯科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202011057689.3/2.html，转载请声明来源钻瓜专利网。

上一篇：一种卷烟用硬盒包装的自动折痕检测装置
下一篇：一种SOC芯片自动化QC方法及装置

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]用于训练图像识别模型的方法和装置在审

专利文献下载