[发明专利]基于生成对抗网络的字体数据处理方法及装置有效
申请号: | 202110288312.7 | 申请日: | 2021-03-17 |
公开(公告)号: | CN112861806B | 公开(公告)日: | 2023-08-22 |
发明(设计)人: | 温琦;袁燚;范长杰;胡志鹏 | 申请(专利权)人: | 网易(杭州)网络有限公司 |
主分类号: | G06V30/32 | 分类号: | G06V30/32;G06V30/19;G06N20/00 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 钟扬飞 |
地址: | 310052 浙江省杭州*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 生成 对抗 网络 字体 数据处理 方法 装置 | ||
1.一种基于生成对抗网络的字体数据处理方法,其特征在于,包括:
确定第一数量个目标字符图像,所述目标字符图像中字符的风格为目标字体;
基于第一数量个目标字符图像,从预先确定的源字体库中渲染得到与所述目标字符图像对应相同的字符的第三数量个源字符图像;
从预先确定的源字体库中随机渲染得到第四数量个源字符图像;第二数量个源字符图像由所述第三数量个源字符图像和所述第四数量个源字符图像构成;所述第二数量大于所述第一数量,所述第二数量个源字符图像中的部分与所述目标字符图像对应相同的字符;所述第一数量个目标字符图像和所述第三数量个源字符图像构成第一图像集,所述第一图像集包括多个第一图像对,每个所述第一图像对包括同一字符对应的目标字符图像和源字符图像;所述第一数量个目标字符图像和所述第四数量个源字符图像构成第二图像集,第二图像集包括多个第二图像对,每个所述第二图像对包括不同字符对应的目标字符图像和源字符图像;
基于所述第一图像集以及第一损失函数对所述生成对抗网络进行第一训练;
基于所述第二图像集以及第二损失函数对所述生成对抗网络进行第二训练;
迭代的交替进行所述第一训练以及第二训练直至符合终止条件,输出训练好的生成器;所述训练好的生成器用于生成所述目标字体的字符图像。
2.根据权利要求1所述的方法,其特征在于,所述第一损失函数基于对抗损失、一致性损失以及对齐损失确定;所述第二损失函数基于所述对抗损失、所述一致性损失以及风格损失确定;其中,所述对抗损失用于指示分布以及分类上的损失,所述一致性损失用于是指示循环能力以及字符属性上的损失,所述对齐损失用于指示内容和特征上的损失,所述风格损失用于指示特征分布上的损失。
3.根据权利要求2所述的方法,其特征在于,所述对抗损失基于主要部分损失和辅助部分损失确定;
所述主要部分损失基于如下公式确定:
所述辅助部分损失基于如下公式确定:
其中,L表示损失函数,x为源域,y为目标域,adv表示对抗,cam表示类激活图,E表示期望,Dt表示判别器,Es表示从源域到目标域的编码器,Gs表示从源域到目标域的解码器,ηDt()表示判别器中添加的辅助分类器,Es和Gs共同构成第一子生成器,所述训练好的生成器包括所述第一子生成器。
4.根据权利要求2所述的方法,其特征在于,所述一致性损失包括循环损失和身份损失;
所述循环损失基于如下公式确定:
所述身份损失基于如下公式确定:
其中,L表示损失函数,x为源域,y为目标域,cycle表示循环,identity表示身份,E表示期望,Es表示从源域到目标域的编码器,Gs表示从源域到目标域的解码器,Et表示从目标域到源域的编码器,Gt表示从目标域到源域的解码器,Et和Gt共同构成第二子生成器,所述训练好的生成器包括所述第二子生成器。
5.根据权利要求2所述的方法,其特征在于,所述对齐损失包括内容损失和特征损失;
所述内容损失基于如下公式确定:
所述特征损失基于如下公式确定;
其中,L表示损失函数,x为源域,y为目标域,L1表示内容,constancy表示不变性,E表示期望,xp表示配对数据,Es表示从源域到目标域的编码器,Gs表示从源域到目标域的解码器,Et表示从目标域到源域的编码器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于网易(杭州)网络有限公司,未经网易(杭州)网络有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110288312.7/1.html,转载请声明来源钻瓜专利网。