[发明专利]分类模型训练方法和设备在审
申请号: | 202010842659.7 | 申请日: | 2020-08-20 |
公开(公告)号: | CN111950647A | 公开(公告)日: | 2020-11-17 |
发明(设计)人: | 侯永杰 | 申请(专利权)人: | 连尚(新昌)网络科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
地址: | 312599 浙江省绍兴市新昌县南*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分类 模型 训练 方法 设备 | ||
本申请实施例公开了分类模型训练方法和设备。分类模型训练方法的一具体实施方式包括:将样本信息输入至初始模型,得到样本信息的预测类别标签;将样本信息的预测类别标签和真实类别标签输入至损失函数,得到样本信息的损失;对样本信息的损失进行动态加权,得到样本信息的加权损失;基于加权损失调整初始模型的参数,得到分类模型。该实施方式在模型训练阶段对样本信息的损失进行动态加权,以调整模型对不同样本信息的学习程度,使得模型优化的方向更符合实际需求,进而提高模型的分类准确度。
技术领域
本申请实施例涉及计算机技术领域,具体涉及分类模型训练方法和设备。
背景技术
在社交媒体中进行高效准确的色情图像识别对于为用户营造安全的网络空间具有十分重要的意义。目前,色情图像识别技术除了基于肤色检测等传统方法外,更主流的方案是采用基于深度学习的图像分类方法。然而,传统的深度学习模型只关注图像是否正确分类以及分类的置信度。
发明内容
本申请实施例提出了分类模型训练方法和设备。
第一方面,本申请实施例提供了一种分类模型训练方法,包括:将样本信息输入至初始模型,得到样本信息的预测类别标签;将样本信息的预测类别标签和真实类别标签输入至损失函数,得到样本信息的损失;对样本信息的损失进行动态加权,得到样本信息的加权损失;基于加权损失调整初始模型的参数,得到分类模型。
在一些实施例中,对样本信息的损失进行动态加权,得到样本信息的加权损失,包括:基于样本信息的损失,确定样本信息的损失权重;基于样本信息的损失权重对样本信息的损失加权,得到加权损失。
在一些实施例中,样本信息的损失权重与样本信息的损失正相关。
在一些实施例中,样本信息是样本文本、样本图像、样本语音和样本视频之一。
在一些实施例中,损失函数是交叉熵损失函数。
在一些实施例中,交叉熵损失函数定义为:其中,1≤i≤n,1≤j≤n,且i,j,n均为正整数,y是样本信息的真实类别标签的独热编码,样本信息属于n类,yi是样本信息属于第i个类别的真实概率的独热编码,z为初始模型的输出,p为z的归一化,代表样本信息的预测类别标签,pi为样本信息属于第i个类别的预测概率。
在一些实施例中,样本信息只属于一个类别,交叉墒损失函数定义为:CEL=-lnpt;其中,样本信息只属于第t个类别,1≤t≤n,且t为正整数,yt=1。
在一些实施例中,加权损失定义为:REL=-αlnpt,其中,α为损失权重,是样本信息的预测类别标签,若样本信息正确分类为第t个类别,则且正确分类标签为yt时的损失权重为λ1,若样本信息错误分类为第j个类别,则则错误分类标签为yj时的损失权重为λ2,若样本信息错误分类为第k个类别,则则错误分类标签为yk时的损失权重为λ3。
在一些实施例中,该方法还包括:获取待识别信息;将待识别信息输入至分类模型,得到待识别信息的类别。
在一些实施例中,样本信息是样本图像;以及该方法还包括:获取待识别图像;利用分类模型检测待识别图像中是否存在违规信息。
在一些实施例中,利用分类模型检测待识别图像中是否存在违规信息,包括:对待识别图像进行预处理,得到预处理图像;将预处理图像输入至分类模型,得到预处理图像的类别;基于预处理图像的类别,确定待识别图像中是否存在违规信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于连尚(新昌)网络科技有限公司,未经连尚(新昌)网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010842659.7/2.html,转载请声明来源钻瓜专利网。