[发明专利]自动生成用于对象识别的训练数据集在审
申请号: | 201880092391.0 | 申请日: | 2018-12-12 |
公开(公告)号: | CN111971686A | 公开(公告)日: | 2020-11-20 |
发明(设计)人: | 崔德华;A·塔姆比拉纳姆;钟鸣;张文辉 | 申请(专利权)人: | 微软技术许可有限责任公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 贾丽萍 |
地址: | 美国华*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 自动 生成 用于 对象 识别 训练 数据 | ||
本公开内容提供了用于自动生成用于对象识别的训练数据集的方法和装置。可以获得多个对象的简档信息。针对所述多个对象中的每个对象,可以基于所述对象的简档信息中包括的所述对象的身份信息来收集与所述对象相关联的初始图像组。可以对所述初始图像组进行过滤以获得与所述对象相关联的经过滤的图像组。可以通过用所述对象的所述身份信息标记所述经过滤的图像组中的每个图像来生成与所述对象相对应的训练数据对组。可以将所述训练数据对组添加到所述训练数据集中。
背景技术
对象识别技术越来越多地用于许多领域,其可包括分类和检测过程。对象识别可以包括对单个对象或类别对象的识别。对象识别的示例是面部识别,其可以识别在一个或多个图像上显示的每个人的相应面部,例如,识别存在由姓名A表示的人、由姓名B表示的人和姓名未知的人,他们有不同的面孔。对象识别的另一个例子是类别识别,其可以识别不同类别的对象,例如,识别存在人、狗、猫、花等。
发明内容
提供本发明内容是为了介绍将在以下具体实施方式中进一步描述的一些概念。其并不旨在标识所要求保护的主题的关键特征或重要特征,也不旨在用于限制所要求保护的主题的范围。
本公开内容的实施例提出了用于自动生成用于对象识别的训练数据集的方法和装置。可以获得多个对象的简档信息。针对所述多个对象中的每个对象,可以基于所述对象的简档信息中包括的所述对象的身份信息来收集与所述对象相关联的初始图像组。可以对所述初始图像组进行过滤以获得与所述对象相关联的经过滤的图像组。可以通过用所述对象的所述身份信息标记所述经过滤的图像组中的每个图像来生成与所述对象相对应的训练数据对组。可以将所述训练数据对组添加到所述训练数据集中。
应该注意的是,上述一个或多个方面包括在下文中充分描述并在权利要求中特别指出的特征。以下描述和附图详细阐述了一个或多个方面的某些说明性特征。这些特征仅指示可以采用各个方面的原理的各种方式,并且本公开内容旨在包括所有这些方面及其等价物。
附图说明
在下文中将结合附图描述所公开的方面,提供附图用于说明而非限制所公开的方面。
图1示出了用于执行对象识别的现有示例性架构。
图2示出了根据实施例的用于生成用于对象识别的训练数据集的示例性一般过程。
图3示出了根据实施例的用于面部识别模型的示例性残余网络。
图4示出了根据实施例的用于生成用于面部识别的训练数据集的示例性过程。
图5示出了根据实施例的用于收集初始面部图像的示例性过程。
图6示出了根据实施例的用于过滤噪声图像的示例性过滤模型。
图7示出了根据实施例的用于过滤噪声图像的另一个示例性过滤模型。
图8示出了根据实施例的用于对同一个对象的经过滤的图像进行组合的示例性组合模型。
图9示出了根据实施例的用于对训练数据集和面部识别模型进行更新的示例性过程。
图10示出了根据实施例的用于生成用于类别识别的训练数据集的示例性过程。
图11示出了根据实施例的用于生成训练数据集的示例性方法的流程图。
图12示出了根据实施例的用于生成训练数据集的示例性装置。
图13示出了根据实施例的用于生成训练数据集的另一个示例性装置。
具体实施方式
现在将参考若干示例实现来讨论本公开内容。应当理解,讨论这些实现仅为了使本领域技术人员能够更好地理解并因此实现本公开内容的实施例而,而不是暗示对本公开内容的范围的任何限制。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201880092391.0/2.html,转载请声明来源钻瓜专利网。