[发明专利]定位图获取模型的训练方法和装置有效
申请号: | 202110258523.6 | 申请日: | 2021-03-09 |
公开(公告)号: | CN113033549B | 公开(公告)日: | 2022-09-20 |
发明(设计)人: | 尚方信;杨叶辉;王磊;许言午 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06V10/22 | 分类号: | G06V10/22;G06V10/764;G06V10/774;G06V10/82;G06K9/62;G06N3/08 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 韩海花 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 位图 获取 模型 训练 方法 装置 | ||
本公开公开了定位图获取模型的训练方法和装置,涉及图像处理技术领域,尤其涉及计算机视觉、深度学习等人工智能领域。该方案为:将样本图像输入定位图获取模型进行类别识别,获取识别出的每个类别的定位图;获取样本图像的标签信息,并结合每个类别的定位图的像素值,获取每个类别对应的损失函数;基于每个类别对应的损失函数,对定位图获取模型进行反向调整,并返回使用下一个样本图像对调整后的定位图像获取模型继续训练,直至训练结束生成目标定位图获取模型。本公开通过类别的定位图和样本图像的标签信息,确定每个类型的损失函数,进而生成模型的损失函数以反向调整模型参数,以引导模型筛选更高注意力的区域,得到优化的定位图。
技术领域
本公开涉及图像处理技术领域,尤其涉及计算机视觉、深度学习等人工智能领域。
背景技术
图像识别是人工智能的一个重要领域,在图像识别的发展中,定位图识别是其中的一项重要技术,有关定位图识别方面的研究取得了很大的进展,定位图识别为进一步的图像识别、分析和理解奠定了基础。
发明内容
本公开提供了一种定位图获取模型的训练方法。通过类别的定位图和样本图像的标签信息,最终确定模型的损失函数来反向调整模型参数,以引导定位图获取模型筛选更高注意力的区域,从而实现定位图的优化。
根据本公开的另一方面,提供了一种定位图获取模型的训练装置。
根据本公开的另一方面,提供了一种电子设备。
根据本公开的另一方面,提供了一种非瞬时计算机可读存储介质。
根据本公开的另一方面,提供了一种计算机程序产品。
为达上述目的,本公开第一方面实施例提出了一种定位图获取模型的训练方法,该方法包括:
将样本图像输入定位图获取模型进行类别识别,获取识别出的每个类别的定位图;
获取样本图像的标签信息,并针对每个类别,根据样本图像的标签信息和每个类别的定位图的像素值和样本图像的标签信息,获取每个类别对应的损失函数;
基于每个类别对应的损失函数,对定位图获取模型进行反向调整,并返回使用下一个样本图像对调整后的定位图像获取模型继续训练,直至训练结束生成目标定位图获取模型。
为达上述目的,本公开第二方面实施例提出了一种定位图获取模型的训练装置,该装置包括:
第一获取模块,用于将样本图像输入定位图获取模型进行类别识别,获取识别出的每个类别的定位图;
第二获取模块,用于获取样本图像的标签信息,并根据样本图像的标签信息和每个根据类别的定位图的像素值,获取每个类别对应的损失函数;
调整模块,用于基于每个类别对应的损失函数,对定位图获取模型进行反向调整,并返回使用下一个样本图像对调整后的定位图像获取模型继续训练,直至训练结束生成目标定位图获取模型。
为达上述目的,本公开第三方面实施例提出了一种电子设备,包括至少一个处理器,以及
与至少一个处理器通信连接的存储器;其中,
存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行本公开第一个方面实施例所述的定位图获取模型的训练方法。
为达上述目的,本公开第四方面实施例提出了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,计算机指令用于使计算机执行本公开第一个方面实施例所述的定位图获取模型的训练方法。
为达上述目的,本公开第五方面实施例提出了一种计算机程序产品,包括计算机程序,计算机程序在被处理器执行时实现本公开第一个方面实施例所述的定位图获取模型的训练方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110258523.6/2.html,转载请声明来源钻瓜专利网。