[发明专利]图像的区域定位方法和目标区域定位模型的训练方法在审
申请号: | 201911004758.1 | 申请日: | 2019-10-22 |
公开(公告)号: | CN110766027A | 公开(公告)日: | 2020-02-07 |
发明(设计)人: | 叶燕罡;陈铭良;沈小勇 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06K9/46 | 分类号: | G06K9/46;G06K9/62 |
代理公司: | 44224 广州华进联合专利商标代理有限公司 | 代理人: | 董慧 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 样本图像 目标区域 初始定位 定位模型 区域定位 激活 注意力集中 定位结果 模型参数 目标类别 目标类型 训练目标 遗漏 图像 申请 | ||
本申请涉及一种图像的区域定位方法和目标区域定位模型的训练方法,其中,目标区域定位模型为使用属于目标类别的样本图像集训练初始定位模型,在训练目标区域定位模型时,通过初始定位模型分别对样本图像集中的各样本图像进行处理,获得各样本图像对应的类激活图,当根据各样本图像的类激活图确定的目标区域未完全覆盖相应样本图像中与目标类型相关的区域时,则继续使用样本图像对初始定位模型的模型参数进行调整,以引导当前的模型将更多注意力集中在该样本图像中被遗漏的目标区域,从而在调整的过程中查漏补缺,使得获得的目标区域定位模型的定位结果更加准确。
技术领域
本申请涉及计算机技术领域,特别是涉及一种图像的区域定位方法、目标区域定位模型的训练方法、装置、计算机可读存储介质和计算机设备。
背景技术
计算机视觉(Computer Vision)有许多不同的应用,比如图像分类和图像定位等等。图像分类与图像定位的区别是图像分类只需要通过计算机模型预测图像所属的类别,也就是预测图像中的具体目标;而图像定位是通过计算机模型识别出图像中的具体目标并定位该目标在图像中的位置的技术。因此,对于监督式学习而言,图像分类的训练数据仅仅需要对样本图像的类别进行标注即可,而图像定位则需要标注目标在图像中的位置及目标类别,显然图像定位所需要的训练数据的标注成本更高。
现有的通过利用神经网络进行图像定位的方法,由于训练数据的标注成本问题,通常仅利用图像的类别信息对图像进行目标区域定位,由于缺少目标区域的监督信息,导致效果较差、定位不准确。
发明内容
基于此,有必要针对现有技术中利用图像的类别信息进行图像定位的方式存在定位效果不准确的技术问题,提供一种图像的区域定位方法、目标区域定位模型的训练方法、装置、计算机可读存储介质和计算机设备。
一种图像的区域定位方法,包括:
获取待处理图像;
通过目标区域定位模型获取所述待处理图像对应的类激活图;
其中,所述目标区域定位模型是使用属于目标类别的样本图像集训练初始定位模型时,当根据各样本图像的类激活图确定的目标区域未完全覆盖相应样本图像中与所述目标类别相关的区域时,则继续使用所述样本图像对所述初始定位模型的模型参数进行调整得到的,各所述样本图像对应的类激活图是通过所述初始定位模型对所述样本图像进行处理获得的;
根据所述待处理图像对应的类激活图确定所述待处理图像中的目标区域。
一种图像的区域定位装置,所述装置包括:
图像获取模块,用于获取待处理图像;
类激活图获取模块,用于通过目标区域定位模型获取所述待处理图像对应的类激活图;其中,所述目标区域定位模型是使用属于目标类别的样本图像集训练初始定位模型时,当根据各样本图像的类激活图确定的目标区域未完全覆盖相应样本图像中与所述目标类别相关的区域时,则继续使用所述样本图像对所述初始定位模型的模型参数进行调整得到的,各所述样本图像对应的类激活图是通过所述初始定位模型对所述样本图像进行处理获得的;
目标区域确定模块,用于根据所述待处理图像对应的类激活图确定所述待处理图像中的目标区域。
一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行上述图像的区域定位方法的步骤。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行上述图像的区域定位方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911004758.1/2.html,转载请声明来源钻瓜专利网。