[发明专利]训练分类模型的装置和方法、以及分类装置和方法有效
申请号: | 201810981422.X | 申请日: | 2018-08-27 |
公开(公告)号: | CN110866533B | 公开(公告)日: | 2023-09-15 |
发明(设计)人: | 沈伟;刘汝杰 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06V10/774 | 分类号: | G06V10/774;G06V10/74;G06V10/82 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王萍;李彦丽 |
地址: | 日本神*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 训练 分类 模型 装置 方法 以及 | ||
公开了一种训练分类模型的装置和方法、以及分类装置和方法,其中,训练分类模型的装置包括:选取训练样本单元,针对从训练集中选取的每个类别随机选取预定数量的样本;选取支持样本单元,在所选取的样本中,随机选取预定数量的样本作为支持样本,并且将除了支持样本之外的样本作为查询样本;获得特征单元,获得支持样本和查询样本的特征;获得原型表示单元,获得类别的原型表示;校正单元,对每个查询样本的特征与每个原型表示之间的距离进行校正,使得每个查询样本的特征与该查询样本所属的类别的原型表示之间的校正后的距离在预定范围内,并且基于校正后的距离计算类间损失;以及训练单元,基于类间损失来训练分类模型。
技术领域
本公开涉及信息处理领域,具体涉及一种训练分类模型的装置和方法、以及分类装置和方法。
背景技术
在图像分类领域的单样本学习中,每一个类别只有一个已知标签的样本,并且将该一个已知标签的样本当做类别的中心。现有技术的单样本学习中可能存在由于样本少而导致学习精度不好的问题,例如可能包括由于稀疏梯度造成的不良初始化的问题,进而影响分类性能。在小样本情况下也存在上述单样本情况下的类似问题。
发明内容
在下文中给出了关于本公开的简要概述,以便提供关于本公开的某些方面的基本理解。但是,应当理解,这个概述并不是关于本公开的穷举性概述。它并不是意图用来确定本公开的关键性部分或重要部分,也不是意图用来限定本公开的范围。其目的仅仅是以简化的形式给出关于本公开的某些概念,以此作为稍后给出的更详细描述的前序。
鉴于以上问题,本公开的目的是提供能够解决现有技术中的一个或多个缺点的训练分类模型的装置和方法、以及分类装置和方法。
根据本公开的一方面,提供了一种训练分类模型的装置,包括:选取训练样本单元,被配置成在每轮训练中,从训练集中随机选取第一预定数量的类别,并且针对所选取的每个类别随机选取第二预定数量的样本;选取支持样本单元,被配置成在所选取的每个类别的所选取的样本中,随机选取第三预定数量的样本作为支持样本,并且将除了支持样本之外的样本作为查询样本;获得特征单元,被配置成分别获得每个支持样本和每个查询样本的特征;获得原型表示单元,被配置成基于每个类别的支持样本的特征,获得该类别的原型表示;校正单元,被配置成对每个查询样本的特征与每个原型表示之间的距离进行校正,使得每个查询样本的特征与该查询样本所属的类别的原型表示之间的校正后的距离在预定范围内,并且基于查询样本的特征与原型表示之间的校正后的距离计算表明不同类别的样本之间的分离程度的类间损失;以及训练单元,被配置成基于类间损失来训练分类模型。
根据本公开的另一方面,提供了一种训练分类模型的方法,包括:选取训练样本步骤,在每轮训练中,从训练集中随机选取第一预定数量的类别,并且针对所选取的每个类别,随机选取第二预定数量的样本;选取支持样本步骤,在所选取的每个类别的所选取的样本中,随机选取第三预定数量的样本作为支持样本,并且将除了支持样本之外的样本作为查询样本;获得特征步骤,分别获得每个支持样本和每个查询样本的特征;获得原型表示步骤,基于每个类别的支持样本的特征,获得该类别的原型表示;校正步骤,对每个查询样本的特征与每个原型表示之间的距离进行校正,使得每个查询样本的特征与该查询样本所属的类别的原型表示之间的校正后的距离在预定范围内,并且基于查询样本的特征与原型表示之间的校正后的距离计算表明不同类别的样本之间的分离程度的类间损失;以及训练步骤,基于类间损失来训练分类模型。
根据本公开的又一方面,提供了一种利用上述训练分类模型的装置训练得到的分类模型进行分类的装置,包括:获得特征单元,被配置成获得待测试集合中的每个待测试信息的特征,其中,待测试集合中的待测试类别与训练集中的类别具有预定程度的关联性;获得原型表示单元,被配置成基于待测试集合中的每个待测试类别的带标签的测试信息的特征,获得该待测试类别的原型表示;以及分类单元,被配置成经由分类模型,计算待测试集合中的每个不带标签的待测试信息的特征与每个待测试类别的原型表示之间的校正后的距离,并且基于所述距离对该待测试信息进行分类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810981422.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种洗衣机滚筒及洗衣机
- 下一篇:掩膜组件、投影模组、光电装置和电子设备