[发明专利]分类模型训练方法和设备在审
申请号: | 202010842659.7 | 申请日: | 2020-08-20 |
公开(公告)号: | CN111950647A | 公开(公告)日: | 2020-11-17 |
发明(设计)人: | 侯永杰 | 申请(专利权)人: | 连尚(新昌)网络科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
地址: | 312599 浙江省绍兴市新昌县南*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分类 模型 训练 方法 设备 | ||
1.一种分类模型训练方法,包括:
将样本信息输入至初始模型,得到所述样本信息的预测类别标签;
将所述样本信息的预测类别标签和真实类别标签输入至损失函数,得到所述样本信息的损失;
对所述样本信息的损失进行动态加权,得到所述样本信息的加权损失;
基于所述加权损失调整所述初始模型的参数,得到分类模型。
2.根据权利要求1所述的方法,其中,所述对所述样本信息的损失进行动态加权,得到所述样本信息的加权损失,包括:
基于所述样本信息的损失,确定所述样本信息的损失权重;
基于所述样本信息的损失权重对所述样本信息的损失加权,得到所述加权损失。
3.根据权利要求2所述的方法,其中,所述样本信息的损失权重与所述样本信息的损失正相关。
4.根据权利要求1-3之一所述的方法,其中,所述样本信息是样本文本、样本图像、样本语音和样本视频之一。
5.根据权利要求1-3之一所述的方法,其中,所述损失函数是交叉熵损失函数。
6.根据权利要求5所述的方法,其中,所述交叉熵损失函数定义为:
其中,1≤i≤n,1≤j≤n,且i,j,n均为正整数,y是所述样本信息的真实类别标签的独热编码,所述样本信息属于n类,yi是所述样本信息属于第i个类别的真实概率的独热编码,z为所述初始模型的输出,p为z的归一化,代表所述样本信息的预测类别标签,pi为所述样本信息属于第i个类别的预测概率。
7.根据权利要求6所述的方法,其中,所述样本信息只属于一个类别,交叉墒损失函数定义为:
CEL=-lnpt;
其中,所述样本信息只属于第t个类别,1≤t≤n,且t为正整数,yt=1。
8.根据权利要求7所述的方法,其中,所述加权损失定义为:
REL=-αlnpt,
其中,α为损失权重,是所述样本信息的预测类别标签,若所述样本信息正确分类为第t个类别,则且正确分类标签为yt时的损失权重为λ1,若所述样本信息错误分类为第j个类别,则则错误分类标签为yj时的损失权重为λ2,若所述样本信息错误分类为第k个类别,则则错误分类标签为yk时的损失权重为λ3。
9.根据权利要求1-8之一所述的方法,其中,所述方法还包括:
获取待识别信息;
将所述待识别信息输入至所述分类模型,得到所述待识别信息的类别。
10.根据权利要求9所述的方法,其中,所述样本信息是样本图像;以及
所述方法还包括:
获取待识别图像;
利用所述分类模型检测所述待识别图像中是否存在违规信息。
11.根据权利要求10所述的方法,其中,所述利用所述分类模型检测所述待识别图像中是否存在违规信息,包括:
对所述待识别图像进行预处理,得到预处理图像;
将所述预处理图像输入至所述分类模型,得到所述预处理图像的类别;
基于所述预处理图像的类别,确定所述待识别图像中是否存在违规信息。
12.一种计算机设备,包括:
一个或多个处理器;
存储装置,其上存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-11中任一所述的方法。
13.一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1-11中任一所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于连尚(新昌)网络科技有限公司,未经连尚(新昌)网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010842659.7/1.html,转载请声明来源钻瓜专利网。