[发明专利]利用部分标记的训练数据训练多类别对象分类模型的系统和方法在审
申请号: | 202080104506.0 | 申请日: | 2020-10-06 |
公开(公告)号: | CN116018621A | 公开(公告)日: | 2023-04-25 |
发明(设计)人: | 陈惠中;鲁志超;乔纳森·兹维·本-麦苏雷姆 | 申请(专利权)人: | 谷歌有限责任公司 |
主分类号: | G06V10/774 | 分类号: | G06V10/774;G06V10/764 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 邓聪惠;周亚荣 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 利用 部分 标记 训练 数据 类别 对象 分类 模型 系统 方法 | ||
本公开的系统和方法涉及一种用于利用部分标记的训练数据来训练机器学习的多类别对象分类模型的计算机实现的方法。该方法能够包括获得描绘对象的图像数据以及包括分别与多个对象类别的对象类别的子集相关联的对象类别注释的子集的基本事实数据。该方法能够包括利用机器学习的多类别对象分类模型来处理该图像数据以获得对象分类数据。该方法能够包括评估损失函数,该损失函数评估多类别分类损失,以及基于该损失函数调整多类别对象分类模型的一个或多个参数。
技术领域
本公开总体上涉及训练机器学习的对象分类模型。更特别地,本公开涉及使用部分标记的训练数据来训练机器学习的多类别对象分类模型,以检测和识别图像数据中描绘的对象的多个类别。
背景技术
训练机器学习的多类别对象分类模型来检测和识别多个对象的类别通常利用图像训练数据,该图像训练数据利用多个类别中的一个或多个的基本事实标记的边界框来标记。该训练数据通常没有被完全标记。也就是说,不是每个类别都有显式标签。相反,一些标签可能是隐式推断的。例如,不被包括在标记的边界框中的图像数据区域(例如,未标记)通常被假定不包括属于这些类别的任何对象。
然而,这些未标记的区域通常包括对应于模型被训练来检测的对象类别的其他对象。作为示例,可以训练模型来识别猫,并且训练图像可以包括未标记区域中的猫。如果隐式地推断出该未标记区域的标签(例如,猫不存在于该区域中),则该模型能够被不正确地训练(例如,被训练为不识别猫的存在)。
因而,为对象分类模型产生训练数据通常需要对训练数据集的图像中描绘的所有类别进行详尽的注释。然而,分类训练数据集的这种注释能够非常昂贵和/或耗时。此外,使用具有部分标记的类别(例如,仅标记三个类别中的两个等)的图像数据来训练模型的现时尝试通常导致模型质量显著下降。
发明内容
本公开的实施例的方面和优点将在以下描述中部分地阐述,或者能够从描述中学习,或者能够通过实施例的实践学习。
本公开的一个示例方面涉及一种利用部分标记的训练数据来训练多类别对象分类模型的计算系统。计算系统能够包括一个或多个处理器。计算系统能够包括被配置成对多个对象类别进行分类的机器学习的多类别对象分类模型。计算系统能够包括存储计算机可读指令的一个或多个有形非暂时性计算机可读介质,这些指令在由一个或多个处理器执行时使得该一个或多个处理器执行操作。该操作能够包括获得描绘一个或多个对象的图像数据以及包括分别与多个对象类别的对象类别的子集相关联的对象类别注释的子集的基本事实数据。该操作能够包括利用机器学习的多类别对象分类模型来处理该图像数据以获得对象分类数据。该操作能够包括评估损失函数,该损失函数评估包括对象分类数据与对象类别注释的子集之间的差异的多类别分类损失,其中损失函数包括分别与多个对象类别相关联的多个加权损失信号,其中加权损失信号中的每一个的权重至少部分地基于与相应损失信号相关联的对象类别包括在对象类别的子集内。操作能够包括至少部分地基于损失函数来调整该机器学习的多类别对象分类模型的一个或多个参数。
本公开的另一示例方面涉及一种用于利用部分标记的训练数据来训练机器学习的多类别对象分类模型的计算机实现的方法。该方法能够包括由包括一个或多个计算设备的计算系统获得描绘一个或多个对象的图像数据以及包括分别与多个对象类别的对象类别的子集相关联的对象类别注释的子集的基本事实数据。该方法能够包括由计算系统利用该机器学习的多类别对象分类模型来处理图像数据以获得对象分类数据。该方法能够包括由计算系统评估损失函数,该损失函数评估包括对象分类数据与对象类别注释的子集之间的差异的多类别分类损失,其中该损失函数包括分别与多个对象类别相关联的多个加权损失信号,其中加权损失信号中的每一个的权重至少部分地基于与相应损失信号相关联的对象类别包括在对象类别的子集内。该方法能够包括由计算系统至少部分地基于该损失函数来调整该机器学习的多类别对象分类模型的一个或多个参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌有限责任公司,未经谷歌有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202080104506.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于血管内恢复静脉瓣膜功能的系统和方法
- 下一篇:显示装置及其制造方法