[发明专利]一种基于强化学习的中文字库自动生成方法及系统有效
申请号: | 202110074336.2 | 申请日: | 2021-01-20 |
公开(公告)号: | CN112732943B | 公开(公告)日: | 2023-09-22 |
发明(设计)人: | 连宙辉;刘亦天 | 申请(专利权)人: | 北京大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/583;G06F16/58;G06F17/18;G06N3/0464;G06N3/092 |
代理公司: | 北京万象新悦知识产权代理有限公司 11360 | 代理人: | 黄凤茹 |
地址: | 100871*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 强化 学习 中文 字库 自动 生成 方法 系统 | ||
本发明公布了一种基于强化学习的中文字库自动生成方法及系统,通过创建强化学习模块输出薄板样条TPS插值函数参数,并应用TPS插值函数将标准汉字骨架的每个笔画转化为目标风格;再对笔画实际位置与尺寸进行预测,将笔画骨架组合为汉字骨架;对汉字骨架进行渲染生成目标汉字图片,从而得到完整的中文字库文件。系统包括:强化学习模块、笔画位置预测模块、渲染模块。本发明实现了对标准笔画骨架的修改和笔画边界框的预测,确保生成更好的目标风格汉字骨架。模型结构简单,无需进行大规模的预训练处理,即可合成高质量的汉字骨架,自动生成高质量的中文字库。
技术领域
本发明涉及计算机图形处理技术和人工智能技术,尤其涉及一种基于强化学习的中文字库自动生成方法及系统。
背景技术
随着现在越来越多的人寻求个性化字体,现有的商业字体库不能满足快速增长的需求。对于包含大量字符(例如中文)的书写系统,产生了很大的需求缺口。中文字体库中包含的字符多,这使得设计新的中文字体非常耗时且成本高昂。此外,字体设计的质量在很大程度上取决于设计师的个人能力和经验。
近些年来,许多研究人员希望自动生成中文字库来解决这一问题。根据处理对象不同,现有方法可以大致分为两组,分别处理字形图像和笔画轨迹。
处理字形图像的方法大多使用卷积神经网络(Convolutional Neural Network,简称CNN)提取汉字图片的内容和字体特征,然后重构特征将源字体中的字形图像转换为目标字体。如文献(Jiang Y,Lian Z,Tang Y,et al.DCFont:an end-to-end deep Chinesefont generation system[M]//SIGGRAPH Asia 2017Technical Briefs.2017:1-4.)记载的“DCFont”使用从字体特征重建网络中提取的样式特征控制输出字体风格,然后使用残差网络建立了从参考字体到目标字体的映射。为了保证输出质量,文献(Sun D,Ren T,Li C,et al.Learning to write stylized chinese characters by reading a handful ofexamples[J].arXiv preprint arXiv:1712.06424,2017.)记载的方法“SA-VAE”将汉字编码为131维向量,作为强引导信息保证输出正确的汉字字形结构。这一类方法可以自动生成较好的汉字字库,但其结果仍存在边缘模糊或字形错误的现象。
处理笔画轨迹的方法,利用了书写过程包含时间和位置信息的特点。这一类方法将汉字视为点序列,例如文献(Tang S,Xia Z,Lian Z,et al.FontRNN:Generating Large-scale Chinese Fonts via Recurrent Neural Network[C]//Computer GraphicsForum.2019,38(7):567-577.)记载的方法“FontRNN”。通过专门设计的循环神经网络(Recurrent Neural Network,简称RNN)模型,FontRNN学习了从输入字形序列到目标字形序列的转换,从而有效地模拟了人类的书写行为。但是,这种方法无法合成高质量的字形轮廓。
发明内容
为了克服上述两类方法生成结果存在的缺陷,本发明提供了一种基于强化学习的中文字库自动生成方法及系统。本发明使用笔画骨架作为引导信息,保证输出汉字的字形正确;与其他处理笔画骨架方法不同,本发明不直接输出新的笔画骨架,而是通过强化学习方法控制薄板样条(Thin-Plate Spline,简称TPS)插值函数,对标准骨架进行形变,并通过额外的神经网络对笔画位置与尺寸进行预测,以拼接骨架。最后使用神经网络对完整汉字骨架进行渲染,生成目标风格汉字字库。
为方便说明,本发明约定以下术语定义:
目标字体风格:由用户输入指定的字体风格。
汉字骨架:完整汉字骨架,由若干个笔画骨架构成。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110074336.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种照明设备及显微镜
- 下一篇:一种中波全频段快速换频装置及其换频方法