[发明专利]使用机器学习模型来对图像进行分类有效
申请号: | 201780047055.X | 申请日: | 2017-07-14 |
公开(公告)号: | CN109564575B | 公开(公告)日: | 2023-09-05 |
发明(设计)人: | 弗朗索瓦·肖莱 | 申请(专利权)人: | 谷歌有限责任公司 |
主分类号: | G06F16/583 | 分类号: | G06F16/583 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 李佳;周亚荣 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 用于使用机器学习模型来对图像进行分类的系统和方法。所述方法中的一种包括:获得用于训练所述机器学习模型的训练数据,其中,所述机器学习模型被配置成处理输入图像以针对每个输入图像生成嵌入空间中的预测点;从针对所述训练数据中的训练图像的标签数据,确定所述对象类别中的每一个对象类别的相应的数字嵌入,其中,任何两个对象类别的数字嵌入之间的所述嵌入空间中的距离反映所述两个对象类别的视觉共现的程度;以及在所述训练数据上训练所述机器学习模型。本说明书中描述的所述系统可有效地执行多标签、大规模多类别图像分类,其中类的数目大(数千或数万)并且其中每个图像通常属于应该全部被适当地识别的多个类别。 | ||
搜索关键词: | 使用 机器 学习 模型 图像 进行 分类 | ||
【主权项】:
1.一种方法,包括:获得训练数据,所述训练数据用于训练具有多个参数的机器学习模型,其中,所述机器学习模型被配置成处理输入图像以针对每个输入图像生成嵌入空间中的预测点,并且其中,所述训练数据包括多个训练图像以及针对每个训练图像的标签数据,所述标签数据从在所述训练图像中描绘的一个或多个对象所属的对象类别集中识别一个或多个对象类别;根据针对所述训练数据中的所述训练图像的所述标签数据,确定所述对象类别集中的所述对象类别中的每一个对象类别的所述嵌入空间中的相应的数字嵌入,其中,任何两个对象类别的数字嵌入之间的所述嵌入空间中的距离反映所述两个对象类别在所述训练图像中的视觉共现的程度;以及在所述训练数据上训练所述机器学习模型,包括,针对所述训练图像中的每一个训练图像:依照所述参数的当前值,使用所述机器学习模型来处理所述训练图像,以针对所述训练图像生成所述嵌入空间中的预测点;以及调整所述参数的当前值,以减小所述嵌入空间中的所述预测点与在针对所述训练图像的所述标签数据中识别的所述对象类别的数字嵌入之间的距离。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌有限责任公司,未经谷歌有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201780047055.X/,转载请声明来源钻瓜专利网。