[发明专利]模型训练的方法、装置、计算机设备及存储介质有效
申请号: | 202111082569.3 | 申请日: | 2021-09-15 |
公开(公告)号: | CN113807430B | 公开(公告)日: | 2023-08-08 |
发明(设计)人: | 温琦;袁燚;范长杰;胡志鹏 | 申请(专利权)人: | 网易(杭州)网络有限公司 |
主分类号: | G06F18/214 | 分类号: | G06F18/214;G06N3/0455;G06N3/08 |
代理公司: | 深圳紫藤知识产权代理有限公司 44570 | 代理人: | 汪阮磊 |
地址: | 310052 浙江省杭州*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 训练 方法 装置 计算机 设备 存储 介质 | ||
1.一种模型训练的方法,其特征在于,包括:
从预设的第一数据集中获取第一文字和第三文字,所述预设的第一数据集中包含具有第一风格的多个文字;
从预设的第二数据集中获取第二文字和第四文字,所述预设的第二数据集中包含具有多种风格的多个文字,其中,所述第二文字和所述第四文字具有第二风格,且所述第二文字与所述第一文字具有相同的文字形态;
将所述第一文字和所述第二文字确定为指定文字,将所述第三文字和所述第四文字确定为随机文字,基于所述指定文字和所述随机文字获取待训练的生成网络的样本文字;
基于所述待训练的生成网络的形态编码器,分别提取所述指定文字的文字形态,生成形态特征向量;
基于所述待训练的生成网络的风格编码器,分别提取所述指定文字和所述随机文字的文字风格,生成风格特征向量;
通过所述待训练的生成网络的解码器,基于所述形态特征向量和所述风格特征向量,生成至少一个预测文字;
基于所述预测文字、所述指定文字和所述随机文字,调整所述待训练的生成网络的参数,得到所述训练完成的生成网络。
2.根据权利要求1所述的方法,其特征在于,所述通过所述待训练的生成网络的解码器,基于所述形态特征向量和所述风格特征向量,生成至少一个预测文字,包括:
通过所述待训练的生成网络的解码器,基于所述第一文字的形态特征向量和风格特征向量,或者基于所述第一文字的风格特征向量和所述第二文字的形态特征向量,或者基于所述第二文字的形态特征向量和所述第三文字的风格特征向量,或者基于所述第一文字的形态特征向量和所述第三文字的风格特征向量,生成所述第一文字对应的第一预测文字;
通过所述待训练的生成网络的解码器,基于所述第二文字的形态特征向量和风格特征向量,或者基于所述第一文字的形态特征向量和所述第二文字的风格特征向量,或者基于所述第二文字的形态特征向量和所述第四文字的风格特征向量,或者基于所述第一文字的形态特征向量和所述第四文字的风格特征向量,生成所述第二文字对应的第二预测文字;
将所述第一预测文字和/或所述第二预测文字作为所述预测文字。
3.根据权利要求1所述的方法,其特征在于,所述基于所述预测文字、所述指定文字和所述随机文字,调整所述待训练的生成网络的参数,得到所述训练完成的生成网络,包括:
基于所述预测文字、所述指定文字和所述随机文字生成对抗损失和/或对齐损失;和/或
基于所述形态特征向量和所述风格特征向量,生成一致损失;
基于所述对抗损失、和/或所述对齐损失,和/或所述一致损失,调整所述待训练的生成网络的参数,得到所述训练完成的生成网络。
4.根据权利要求1所述的方法,其特征在于,所述文字形态包括形态组成结构,所述从预设的第一数据集中获取第三文字,包括:
确定所述第一文字的形态组成结构,作为第一形态组成结构,在所述第一数据集中除所述第一文字外的其他文字中确定一具有所述第一形态组成结构的文字作为所述第三文字;
所述从预设的第二数据集中获取第四文字,包括:
确定所述第二文字的形态组成结构,作为第二形态组成结构,在所述第二数据集中除所述第二文字外的其他文字中确定具有所述第二形态组成结构的文字作为所述第四文字。
5.根据权利要求1所述的方法,其特征在于,所述基于所述预测文字、所述指定文字和所述随机文字,调整所述待训练的生成网络的参数,得到所述训练完成的生成网络之后,还包括:
获取具有目标风格的目标文字,以及待进行风格转换的源文字;
通过所述训练完成的生成网络中的风格编码器对所述目标文字的所述目标风格进行分析,得到所述目标文字的风格特征向量;
通过所述训练完成的生成网络中的形态编码器对所述源文字的文字形态进行分析,得到所述源文字的形态特征向量;
通过所述训练完成的生成网络中的解码器,基于所述目标文字的目标风格特征向量和所述源文字的形态特征向量进行文字生成,得到所述源文字的文字风格转换后的预测文字。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于网易(杭州)网络有限公司,未经网易(杭州)网络有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111082569.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:产品信息的推送方法及装置
- 下一篇:一种海裙花及其制备方法和应用