[发明专利]文字生成模型的训练方法、文字生成方法及其装置有效

申请号：	202210777263.8	申请日：	2022-06-30
公开（公告）号：	CN115147850B	公开（公告）日：	2023-05-05
发明（设计）人：	尚太章;唐礼承;刘家铭;洪智滨	申请（专利权）人：	北京百度网讯科技有限公司
主分类号：	G06V30/19	分类号：	G06V30/19;G06V30/148;G06V10/26;G06V10/774;G06V10/80;G06V10/82;G06N3/0464;G06N3/08
代理公司：	北京清亦华知识产权代理事务所(普通合伙) 11201	代理人：	罗岚
地址：	100085 北京市***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	文字生成模型训练方法及其装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本公开提供了文字生成模型的训练方法、文字生成方法及其装置，涉及人工智能技术领域，尤其涉及深度学习、图像处理、计算机视觉技术领域，该方法包括：获取多个训练文字对，其中，任一训练文字对中包括第一字体下的样本文字，和样本文字对应的第二字体下的参考文字；对样本文字进行分割，获取样本文字的N个组成元素；根据样本文字和N个组成元素获取融合特征表示，以及获取参考文字的第一特征表示；基于融合特征表示和第一特征表示对文字生成模型进行训练，以获取目标文字生成模型。本申请实施例可以捕捉字体中的部首信息进行学习，可以实现文字生成效果的优化，提高生成字体的效率的同时，也提高了字体生成的准确率。

技术领域

本公开涉及人工智能技术领域，尤其涉及深度学习、图像处理、计算机视觉技术领域，可应用于光学字符识别(Optical Character Recognition，OCR)等场景。

背景技术

相关技术中，输入法中的字体设计具有很复杂的流程，设计一套新的字体，需要字体设计人员耗费大量精力和时间，而对于复杂的语言，比如汉字，韩文，日文等等，往往不能很好的保留细节。因此，如何提高生成字体的效率以及准确率，已经成为重要的研究方向之一。

发明内容

本公开提供了一种文字生成模型的训练方法、文字生成方法及其装置。

根据本公开的一方面，提供了一种文字生成模型的训练方法，包括：

获取多个训练文字对，其中，任一训练文字对中包括第一字体下的样本文字，和样本文字对应的第二字体下的参考文字；

对样本文字进行分割，获取样本文字的N个组成元素，N为正整数；

根据样本文字和N个组成元素获取融合特征表示，以及获取参考文字的第一特征表示；

基于融合特征表示和第一特征表示对文字生成模型进行训练，以获取目标文字生成模型。

本申请实施例可以捕捉字体中的部首信息进行学习，可以实现文字生成效果的优化，提高生成字体的效率的同时，也提高了字体生成的准确率。