[发明专利]信息处理方法和信息处理装置有效
申请号: | 201711159683.5 | 申请日: | 2017-11-20 |
公开(公告)号: | CN109815971B | 公开(公告)日: | 2023-03-10 |
发明(设计)人: | 王梦蛟;刘汝杰 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06F18/2411 | 分类号: | G06F18/2411;G06F18/2413;G06F18/21;G06N3/0464;G06N3/047;G06N3/08 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王萍;李彦丽 |
地址: | 日本神*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信息处理 方法 装置 | ||
1.一种信息处理方法,包括:
将多个样本分别输入到分类器中以提取表征每个样本的特征的特征向量;以及
对于所述多个样本,通过使损失函数最小化来更新所述分类器的参数,其中,所述损失函数与用于衡量属于同一类的样本的特征向量之间的距离的类内距离正相关,与用于衡量属于不同类的样本的特征向量之间的距离的类间距离负相关,其中,所述多个样本中的每个样本的类内距离均小于第一阈值,两个不同的类之间的类间距离大于第二阈值,并且所述第二阈值大于所述第一阈值的两倍,
其中,对于所述两个不同的类,计算所述两个不同的类中的一个类的中心向量与另一个类的中心向量之间的距离,作为所述两个不同的类之间的类间距离,以及
基于每个类中的所有样本的特征向量计算每个类的特征向量方差,将所计算出的最小特征向量方差和最大特征向量方差的平均值作为所述第一阈值。
2.根据权利要求1所述的信息处理方法,其中,所述分类器包括卷积神经网络。
3.根据权利要求1所述的信息处理方法,其中,计算每个样本的特征向量与该样本所属的类的中心向量之间的距离,作为该样本的类内距离。
4.根据权利要求1或3所述的信息处理方法,其中,每个类的所述中心向量是属于该类的所有样本的特征向量的平均值。
5.根据权利要求1所述的信息处理方法,其中,在迭代训练所述分类器时,根据所述损失函数更新所述分类器的参数,从而更新样本的特征向量,并且在每迭代预定次数时,更新所述第一阈值和所述第二阈值。
6.根据权利要求1所述的信息处理方法,其中,除了所述类内距离和所述类间距离之外,所述损失函数还包括softmax损失函数。
7.一种信息处理装置,包括:
提取特征向量单元,被配置成将多个样本分别输入到分类器中以提取表征每个样本的特征的特征向量;以及
更新参数单元,被配置成对于所述多个样本,通过使损失函数最小化来更新所述分类器的参数,其中所述损失函数与用于衡量属于同一类的样本的特征向量之间的距离的类内距离正相关,与用于衡量属于不同类的样本的特征向量之间的距离的类间距离负相关,其中,所述多个样本中的每个样本的类内距离均小于第一阈值,两个不同的类之间的类间距离大于第二阈值,并且所述第二阈值大于或等于所述第一阈值的两倍,
其中,在所述更新参数单元中,对于所述两个不同的类,计算所述两个不同的类中的一个类的中心向量与另一个类的中心向量之间的距离,作为所述两个不同的类之间的类间距离,以及
基于每个类中的所有样本的特征向量计算每个类的特征向量方差,将所计算出的最小特征向量方差和最大特征向量方差的平均值作为所述第一阈值。
8.一种记录有指令的计算机可读记录介质,所述指令在被执行时使得:
将多个样本分别输入到分类器中以提取表征每个样本的特征的特征向量;以及
对于所述多个样本,通过使损失函数最小化来更新所述分类器的参数,其中,所述损失函数与用于衡量属于同一类的样本的特征向量之间的距离的类内距离正相关,与用于衡量属于不同类的样本的特征向量之间的距离的类间距离负相关,其中,所述多个样本中的每个样本的类内距离均小于第一阈值,两个不同的类之间的类间距离大于第二阈值,并且所述第二阈值大于所述第一阈值的两倍,
其中,对于所述两个不同的类,计算所述两个不同的类中的一个类的中心向量与另一个类的中心向量之间的距离,作为所述两个不同的类之间的类间距离,以及
基于每个类中的所有样本的特征向量计算每个类的特征向量方差,将所计算出的最小特征向量方差和最大特征向量方差的平均值作为所述第一阈值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711159683.5/1.html,转载请声明来源钻瓜专利网。