[发明专利]训练图像模型的方法和装置以及分类预测方法和装置在审
申请号: | 201810205269.1 | 申请日: | 2018-03-13 |
公开(公告)号: | CN110276362A | 公开(公告)日: | 2019-09-24 |
发明(设计)人: | 沈伟;刘汝杰 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/08 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王萍;李彦丽 |
地址: | 日本神*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 样本图像 方法和装置 尺度调整 训练图像 对象提取 分类 预测 局部预测 图像模型 尺度 局部分类器 更新对象 提取部件 预测结果 特征点 裁剪 图像 更新 | ||
公开了一种训练图像模型的方法和装置以及分类预测方法和装置。训练图像模型的方法在针对每个样本图像进行的每轮训练中:将通过上一轮训练所得到的对象提取部件对样本图像进行裁剪而得到的图像作为尺度调整后的样本图像输入到图像模型,对象提取部件用于提取各个尺度的样本图像中的关注的对象,初始尺度的样本图像为原始的样本图像;将尺度调整后的样本图像的特征分别输入到图像模型中的局部分类器,针对特征中的特征点进行分类预测,从而得到局部预测结果,并且基于局部预测结果,更新对象提取部件;基于特征和更新后的对象提取部件,对尺度调整后的样本图像进行对象级分类预测;以及基于尺度调整后的样本图像的分类预测结果,训练图像模型。
技术领域
本公开涉及信息处理领域,具体涉及能够获得快速并准确地对不同尺度的图像进行分类的经训练的图像模型的训练图像模型的方法和装置、以及能够快速并准确地对不同尺度的图像进行分类的分类预测方法和装置。
背景技术
如果对象的尺度动态地改变,则对象分类是困难的。对于给定的图像,对象可能占用整个图像或者可能占用图像的一小部分。就对于对象尺度敏感的当前的对象分类模型诸如卷积神经网络(CNN)模型而言,这提出了很大的挑战。在单尺度上利用对象训练的模型在该尺度针对对象分类时将是良好的,然而,如果测试对象在不同的尺度,则该模型的性能将下降。为了处理不同尺度的对象,研究者们利用不同尺度的对象训练模型。然而,这要求对象的包围框是已知的,使得可以在不同的尺度裁剪和缩放对象。包围框的手工标注既耗时又消耗人力。
此外,现有技术中利用上述方式训练所得到的模型通常准确度不高,导致对对象的分类不太准确。
发明内容
在下文中给出了关于本公开的简要概述,以便提供关于本公开的某些方面的基本理解。但是,应当理解,这个概述并不是关于本公开的穷举性概述。它并不是意图用来确定本公开的关键性部分或重要部分,也不是意图用来限定本公开的范围。其目的仅仅是以简化的形式给出关于本公开的某些概念,以此作为稍后给出的更详细描述的前序。
鉴于以上问题,本公开的目的是提供能够解决现有技术中的一个或多个缺点的训练图像模型的方法和装置以及分类预测方法和装置。
根据本公开的一方面,提供了一种训练图像模型的方法,包括:可以针对训练集中的每个样本图像对图像模型执行N轮迭代训练,其中,N是大于或等于2的整数,以及基于针对训练集中所有样本图像的训练结果来获得训练完成的图像模型。其中,在针对每个样本图像执行的每轮训练中进行以下处理:将通过上一轮训练所得到的对象提取部件对样本图像进行裁剪而得到的图像作为尺度调整后的样本图像输入到图像模型,其中,对象提取部件可以用于提取各个尺度的样本图像中的关注的对象,初始尺度的样本图像为原始的样本图像;将尺度调整后的样本图像的特征分别输入到图像模型中的预定数量的局部分类器,可以针对所述特征中的特征点进行分类预测,从而得到局部预测结果,并且可以基于局部预测结果,更新对象提取部件;基于所述特征和更新后的对象提取部件,对尺度调整后的样本图像进行对象级分类预测;以及基于尺度调整后的样本图像的分类预测结果,训练图像模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810205269.1/2.html,转载请声明来源钻瓜专利网。