[发明专利]信息处理方法和信息处理装置有效
申请号: | 201711159683.5 | 申请日: | 2017-11-20 |
公开(公告)号: | CN109815971B | 公开(公告)日: | 2023-03-10 |
发明(设计)人: | 王梦蛟;刘汝杰 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06F18/2411 | 分类号: | G06F18/2411;G06F18/2413;G06F18/21;G06N3/0464;G06N3/047;G06N3/08 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王萍;李彦丽 |
地址: | 日本神*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信息处理 方法 装置 | ||
公开了一种信息处理方法和信息处理装置,其中信息处理方法包括:将多个样本分别输入到分类器中以提取表征每个样本的特征的特征向量;以及对于多个样本,通过使损失函数最小化来更新分类器的参数,其中,损失函数与用于衡量属于同一类的样本的特征向量之间的距离的类内距离正相关,与用于衡量属于不同类的样本的特征向量之间的距离的类间距离负相关,其中,多个样本中的每个样本的类内距离均小于第一阈值,两个不同的类之间的类间距离大于第二阈值,并且第二阈值大于第一阈值的两倍。根据本公开的实施例,可以提高提取的样本的特征的可判别性。
技术领域
本公开涉及信息处理领域,具体涉及能够提高提取的样本的特征的可判别性的信息处理方法和信息处理装置。
背景技术
在卷积神经网络训练的过程中,损失函数的设计扮演着重要的角色。不同的损失函数可以导致卷积神经网络产生完全不同的性能。在以分类为目标的卷积神经网络模型中,最常见的损失函数是softmax损失函数。使用softmax损失函数可以使得不同类别样本之间具有可分性。对于分类问题而言,样本特征不仅要可分,同时还要具有可判别性。后者要求样本特征要具有更小的类内距离以及更大的类间距离。softmax损失函数则仅仅保证了样本特征的可分性,而没有考虑特征的可判别性。最近提出了一种新型的损失函数centerloss,其通过最小化各个样本的特征向量至类的中心向量的距离,从而使得样本特征具有更小的类内距离。然而,根据样本可判别性的定义,样本特征不仅要具有更小的类间距离,还要有更大的类间距离。而在centerloss损失函数中,类间距离并没有得到体现。
发明内容
在下文中给出了关于本公开的简要概述,以便提供关于本公开的某些方面的基本理解。但是,应当理解,这个概述并不是关于本公开的穷举性概述。它并不是意图用来确定本公开的关键性部分或重要部分,也不是意图用来限定本公开的范围。其目的仅仅是以简化的形式给出关于本公开的某些概念,以此作为稍后给出的更详细描述的前序。
鉴于以上问题,本公开的目的是提供能解决现有技术中的一个或多个缺点的信息处理方法和信息处理装置。
根据本公开的一方面,提供了一种信息处理方法,包括:可以将多个样本分别输入到分类器中以提取表征每个样本的特征的特征向量;以及对于多个样本,可以通过使损失函数最小化来更新分类器的参数,其中,损失函数与用于衡量属于同一类的样本的特征向量之间的距离的类内距离正相关,与用于衡量属于不同类的样本的特征向量之间的距离的类间距离负相关,其中,多个样本中的每个样本的类内距离均小于第一阈值,两个不同的类之间的类间距离大于第二阈值,并且第二阈值大于第一阈值的两倍。
根据本公开的另一方面,提供了一种信息处理装置,包括:提取特征向量单元,可以被配置成将多个样本分别输入到分类器中以提取表征每个样本的特征的特征向量;以及更新参数单元,被配置成对于多个样本,可以通过使损失函数最小化来更新分类器的参数,其中,损失函数与用于衡量属于同一类的样本的特征向量之间的距离的类内距离正相关,与用于衡量属于不同类的样本的特征向量之间的距离的类间距离负相关,其中,多个样本中的每个样本的类内距离均小于第一阈值,两个不同的类之间的类间距离大于第二阈值,并且第二阈值大于第一阈值的两倍。
根据本公开的又一方面,提供了一种记录有指令的计算机可读记录介质,所述指令在被执行时使得:可以将多个样本分别输入到分类器中以提取表征每个样本的特征的特征向量;以及对于多个样本,可以通过使损失函数最小化来更新分类器的参数,其中,损失函数与用于衡量属于同一类的样本的特征向量之间的距离的类内距离正相关,与用于衡量属于不同类的样本的特征向量之间的距离的类间距离负相关,其中,多个样本中的每个样本的类内距离均小于第一阈值,两个不同的类之间的类间距离大于第二阈值,并且第二阈值大于第一阈值的两倍。
根据本公开的其它方面,还提供了用于实现上述根据本公开的方法的计算机程序代码和计算机程序产品。
在下面的说明书部分中给出本公开实施例的其它方面,其中,详细说明用于充分地公开本公开实施例的优选实施例,而不对其施加限定。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711159683.5/2.html,转载请声明来源钻瓜专利网。