[发明专利]一种模型训练方法、装置、电子设备及其存储介质在审
申请号: | 202110040360.4 | 申请日: | 2021-01-13 |
公开(公告)号: | CN113807494A | 公开(公告)日: | 2021-12-17 |
发明(设计)人: | 李银锋;孔滕滕;田俊文;周彬;李晓敏;晏梦佳 | 申请(专利权)人: | 北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06F40/279;G06Q30/06 |
代理公司: | 北京德琦知识产权代理有限公司 11018 | 代理人: | 郑红娟;宋志强 |
地址: | 100083 北京市海淀区杏石口路6*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 模型 训练 方法 装置 电子设备 及其 存储 介质 | ||
1.一种模型训练方法,其特征在于,该方法包括:
接收预处理后的训练样本;
根据预处理后的所述训练样本通过预置的训练模型网络按照预定替换方式,将预置的至少一个卷积层替换部分所述训练模型网络的对应网络层进行训练得到训练后的卷积层;
通过训练后的卷积层部署替换对应所述网络层得到训练模型。
2.根据权利要求1所述的模型训练方法,其特征在于,所述接收预处理后的训练样本包括:
获取待训练的文本训练样本;
按预定删除方式删除所述文本训练样本中的非文字字符;
对删除所述非文字字符的所述文本训练样本模型添加索引编码和字符向量得到文本向量,其中,所述索引编码用于描述所述文本训练样本中字符的内容,所述字符向量用于描述所述文本训练样本中字符的顺序;
对所述文本向量进行归一化处理得到输出向量完成对所述训练样本的预处理。
3.根据权利要求2所述的模型训练方法,其特征在于,所述根据预处理后的所述训练样本通过预置的训练模型网络按照预定替换方式,将预置的卷积层替换部分所述训练模型网络的对应网络层进行训练得到训练后的卷积层包括:
将预置的至少一个卷积层与训练模型网络中不同部分的网络层建立对应关系;
根据预处理后的所述训练样本通过预置的训练模型网络按照随机替换方式将预置的卷积层替换部分所述训练模型网络中对应的网络层进行训练得到训练后的卷积层。
4.根据权利要求3所述的模型训练方法,其特征在于,所述根据预处理后的所述训练样本通过预置的训练模型网络按照随机替换方式,将预置的卷积层替换部分所述训练模型网络中对应的网络层进行训练得到训练后的卷积层包括:
创建连续的至少一个数值区间,其中,所述数值区间的个数与所述卷积层的个数相同并与不同的所述卷积层对应;
随机生成一个数值,其中,所述数值为属于所述至少一个数值区间的值;
选取所述数值属于所述数值区间的对应所述卷积层;
将对应的所述卷积层替换对应的所述网络层,并根据预处理后的所述训练样本进行训练得到训练后的卷积层。
5.根据权利要求4所述的模型训练方法,其特征在于,所述将对应的所述卷积层替换对应的所述网络层,并根据预处理后的所述训练样本进行训练得到训练后的卷积层包括:
将对应的所述卷积层替换对应的所述网络层,并根据预处理后的所述训练样本通过分类器层得到所述训练样本中第一类所述训练样本和第二类所述训练样本的分布概率,其中,所述训练样本包括确定分类的第一类所述训练样本和第二类所述训练样本;
根据所述分布概率优化所述卷积层得到能够符合概率要求的训练后的卷积层。
6.一种模型训练方法,其特征在于,该方法包括:
接收预处理后的违规文本训练样本;
根据预处理后的所述违规文本训练样本通过预置的违规文本训练模型网络按照预定替换方式,将预置的至少一个卷积层替换部分所述违规文本训练模型网络的对应网络层进行训练得到训练后的卷积层;
通过训练后的卷积层部署替换对应所述网络层得到违规文本训练模型。
7.根据权利要求6所述的模型训练方法,其特征在于,所述接收预处理后的违规文本训练样本步骤前,该方法还包括:
获取电商平台的商品信息,其中,所述商品信息为文字形式的数据信息;
将所述商品信息按照预定分类方式分为违规训练样本和非违规训练样本;
将分类后的所述商品信息进行存储作为待预处理的所述违规文本训练样本。
8.一种模型训练装置,其特征在于,所述装置包括:
接收模块,用于接收预处理后的训练样本;
替换模块,用于根据预处理后的所述训练样本通过预置的训练模型网络按照预定替换方式将预置的至少一个卷积层替换部分所述训练模型网络的对应网络层进行训练得到训练后的卷积层;
部署构建模块,用于通过训练后的卷积层部署替换对应所述网络层得到训练模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司,未经北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110040360.4/1.html,转载请声明来源钻瓜专利网。