[发明专利]文字生成模型的训练方法、文字生成方法及其装置有效
申请号: | 202210777263.8 | 申请日: | 2022-06-30 |
公开(公告)号: | CN115147850B | 公开(公告)日: | 2023-05-05 |
发明(设计)人: | 尚太章;唐礼承;刘家铭;洪智滨 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06V30/19 | 分类号: | G06V30/19;G06V30/148;G06V10/26;G06V10/774;G06V10/80;G06V10/82;G06N3/0464;G06N3/08 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 罗岚 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文字 生成 模型 训练 方法 及其 装置 | ||
本公开提供了文字生成模型的训练方法、文字生成方法及其装置,涉及人工智能技术领域,尤其涉及深度学习、图像处理、计算机视觉技术领域,该方法包括:获取多个训练文字对,其中,任一训练文字对中包括第一字体下的样本文字,和样本文字对应的第二字体下的参考文字;对样本文字进行分割,获取样本文字的N个组成元素;根据样本文字和N个组成元素获取融合特征表示,以及获取参考文字的第一特征表示;基于融合特征表示和第一特征表示对文字生成模型进行训练,以获取目标文字生成模型。本申请实施例可以捕捉字体中的部首信息进行学习,可以实现文字生成效果的优化,提高生成字体的效率的同时,也提高了字体生成的准确率。
技术领域
本公开涉及人工智能技术领域,尤其涉及深度学习、图像处理、计算机视觉技术领域,可应用于光学字符识别(Optical Character Recognition,OCR)等场景。
背景技术
相关技术中,输入法中的字体设计具有很复杂的流程,设计一套新的字体,需要字体设计人员耗费大量精力和时间,而对于复杂的语言,比如汉字,韩文,日文等等,往往不能很好的保留细节。因此,如何提高生成字体的效率以及准确率,已经成为重要的研究方向之一。
发明内容
本公开提供了一种文字生成模型的训练方法、文字生成方法及其装置。
根据本公开的一方面,提供了一种文字生成模型的训练方法,包括:
获取多个训练文字对,其中,任一训练文字对中包括第一字体下的样本文字,和样本文字对应的第二字体下的参考文字;
对样本文字进行分割,获取样本文字的N个组成元素,N为正整数;
根据样本文字和N个组成元素获取融合特征表示,以及获取参考文字的第一特征表示;
基于融合特征表示和第一特征表示对文字生成模型进行训练,以获取目标文字生成模型。
本申请实施例可以捕捉字体中的部首信息进行学习,可以实现文字生成效果的优化,提高生成字体的效率的同时,也提高了字体生成的准确率。
根据本公开的另一方面,提供了一种文字生成方法,包括:
将第一字体下的待生成文字输入到目标文字生成模型中进行文字生成,输出待生成文字对应的第二字体下的目标文字,目标文字生成模型根据如上述的文字生成模型的训练方法得到。
本申请实施例能够灵活多变的获取用户需要的字体,减少了字体设计的难度,实现文字生成效果的优化,提高生成字体的效率的同时,也提高了字体生成的准确率。
根据本公开的一方面,提供了一种文字生成模型的训练装置,包括:
第一获取模块,用于获取多个训练文字对,其中,任一训练文字对中包括第一字体下的样本文字,和样本文字对应的第二字体下的参考文字;
分割模块,用于对样本文字进行分割,获取样本文字的N个组成元素,N为正整数;
第二获取模块,用于根据样本文字和N个组成元素获取融合特征表示,以及获取参考文字的第一特征表示;
训练模块,用于基于融合特征表示和第一特征表示对文字生成模型进行训练,以获取目标文字生成模型。
根据本公开的一方面,提供了一种文字生成装置,包括:
文字生成模块,用于将第一字体下的待生成文字输入到目标文字生成模型中进行文字生成,输出待生成文字对应的第二字体下的目标文字,目标文字生成模型根据如上述的文字生成模型的训练装置得到。
根据本公开的一方面,提出了一种电子设备,包括至少一个处理器,以及
与至少一个处理器通信连接的存储器;其中,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210777263.8/2.html,转载请声明来源钻瓜专利网。