[发明专利]特征模型训练方法、装置、设备及存储介质在审
申请号: | 202010319373.0 | 申请日: | 2020-04-21 |
公开(公告)号: | CN111553399A | 公开(公告)日: | 2020-08-18 |
发明(设计)人: | 黄振杰;李德紘;张少文;冯琰一 | 申请(专利权)人: | 佳都新太科技股份有限公司;广州佳都科技软件开发有限公司;广州新科佳都科技有限公司;广东华之源信息工程有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京权智天下知识产权代理事务所(普通合伙) 11638 | 代理人: | 王新爱 |
地址: | 511400 广东省广州市番禺区东环街迎宾*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 特征 模型 训练 方法 装置 设备 存储 介质 | ||
1.一种特征模型训练方法,其特征在于,包括:
获取训练数据集,所述训练数据集中每个样本对应一个标签,所述标签用于标识对应样本所属的类别;
将所述训练数据集输入至神经网络模型,以得到每个所述样本的特征向量;
根据所述训练数据集中各样本对应的特征向量以及所属的类别,构建类内损失函数和类间损失函数;
根据所述类内损失函数和所述类间损失函数确定所述神经网络模型的损失函数;
对包含所述损失函数的所述神经网络模型进行训练,直到所述损失函数收敛为止。
2.根据权利要求1所述的特征模型训练方法,其特征在于,所述根据所述训练数据集中各样本对应的特征向量以及所属的类别,构建类内损失函数和类间损失函数包括:
获取所述神经网络模型中全连接层的权重参数矩阵,所述权重参数矩阵中第p列的权重参数表示第p个类别对应的权重参数向量;
根据所述权重参数矩阵确定各类别对应的簇中心;
根据各所述簇中心以及各所述类别下的特征向量确定类内损失函数;
根据各所述簇中心确定类间损失函数。
3.根据权利要求2所述的特征模型训练方法,其特征在于,所述根据各所述簇中心以及各所述类别下的特征向量确定类内损失函数包括:
根据特征向量所属的类别确定可学习角度;
根据所述特征向量、目标簇中心和所述可学习角度确定所述特征向量与所述目标簇中心之间的第一类内距离,所述目标簇中心为所述特征向量所属类别对应的簇中心,每个特征向量对应一个第一类内距离;
根据所述特征向量和其他簇中心确定所述特征向量和所述其他簇中心之间的第二类内距离,所述其他簇中心为全部簇中心中除去相应目标簇中心外的簇中心,每个特征向量对应一组其他簇中心,每个其他簇中心对应一个第二类内距离;
根据全部类别的可学习角度确定惩罚项;
根据第一类内距离、第二类内距离以及所述惩罚项确定类内损失函数。
4.根据权利要求3所述的特征模型训练方法,其特征在于,所述类内损失函数的计算公式为:
其中,Sintra表示类内损失函数,M为神经网络模型训练过程中每次迭代过程选取的样本数量,s为比例因子,ω1为第一平衡因子,Rjm为第j个样本的特征向量yj对应的第一类内距离,为yj与yj对应的目标簇中心之间的角度,Wy表示yj对应的目标簇中心,yj属于第y个类别,m1为第一超参数,my为第y个类别对应的可学习角度,Rji为yj与第i个其他簇中心之间的第二类内距离,Rji=WiTyj,Wi为第i个其他簇中心,C为类别的总数量,Lm为惩罚项,
5.根据权利要求2所述的特征模型训练方法,其特征在于,所述根据各所述簇中心确定类间损失函数包括:
根据各所述簇中心计算不同类别之间的第一类间距离;
在每个类别对应的全部第一类间距离中选择大于距离阈值的第二类间距离,并计算每个类别的第二类间距离和值;
根据每个类别对应的第二类间距离和值确定类间损失函数。
6.根据权利要求5所述的特征模型训练方法,其特征在于,所述类间损失函数的计算公式为:
其中,Sinter表示类间损失函数,C为类别的总数量,Dz为第z个类别对应的第二类间距离和值,为第z个类别与第q个类别之间的第一类间距离,m2为第二超参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于佳都新太科技股份有限公司;广州佳都科技软件开发有限公司;广州新科佳都科技有限公司;广东华之源信息工程有限公司,未经佳都新太科技股份有限公司;广州佳都科技软件开发有限公司;广州新科佳都科技有限公司;广东华之源信息工程有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010319373.0/1.html,转载请声明来源钻瓜专利网。