[发明专利]一种基于矢量量化的变分自编码机的多风格字体生成方法有效
申请号: | 201911241906.1 | 申请日: | 2019-12-06 |
公开(公告)号: | CN111161266B | 公开(公告)日: | 2022-03-25 |
发明(设计)人: | 张九龙;温昕燃;屈晓娥 | 申请(专利权)人: | 西安理工大学 |
主分类号: | G06T7/10 | 分类号: | G06T7/10;G06T3/00 |
代理公司: | 西安弘理专利事务所 61214 | 代理人: | 曾庆喜 |
地址: | 710048 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 矢量 量化 编码 风格 字体 生成 方法 | ||
本发明公开了一种基于矢量量化的变分自编码机的多风格字体生成方法,建立固定字体风格的汉字图片的取样样本;根据取样样本,通过调试过的固定尺寸的框和步长依次对取样样本的字符进行切割,经调试后的框内只包括一个字,将框内的数据读取出来,转成图片保存,即切割出单个字体的图像,切割后随机选取图像作为需要扩充的风格字体的数据集,作为最终训练数据;将得到的最终训练数据输入网络结构进行迭代和训练,并将网络输出得到的损失值输入优化器来更新编码器权重和解码器权重,以及量化隐向量的参数值;将单个训练样本和待扩展的汉字数据样本带入经更新的编码器和解码器中进行重构,得到进行风格扩充后的字体样本。
技术领域
本发明属于图像处理与人工智能深度学习技术领域,涉及一种基于矢量量化的变分自编码机的多风格字体生成方法。
背景技术
文字作为信息的载体,不仅传达了人们想要表达的内容,文字的样式作为一种艺术形式也逐渐被人们开发起来。在海报设计,标语设计等方面,使用合适的字体在阅读时更能吸引读者的注意力,也极大的提高了文字整体的美观度。现已有的一些办公软件和图片处理软件已经内置了很多常用的风格字体,网络上也有很多个人或企业设计的其他样式的字体。但部分风格字体的字库在设计时没有囊括一些不常用的汉字,而使用者会因此产生字体风格样式不统一的情况,影响了设计的美观度。不同风格字体字库在设计时需要设计师来设计主体的风格,从而扩展到其他文字,但为了使字库囊括所有的汉字,又会增加设计师的工作量,消耗更多的人力与物力。
鉴于以上种种原因,如何在现有风格字体字库的基础上对字库中不包含的汉字进行风格扩充,同时保证扩充时风格的准确性,成为当下需要解决的一个问题。
发明内容
本发明的目的是提供一种基于矢量量化的变分自编码机的多风格字体生成方法,解决了现有技术中存在的风格字体字库中的部分非常用汉字不具备相同风格,设计其他风格字体字库时费时费力的问题。
本发明所采用的技术方案是,一种基于矢量量化的变分自编码机的多风格字体生成方法,包括以下步骤:
步骤1、建立固定字体风格的汉字图片的取样样本;
步骤2、根据步骤1中的取样样本,通过调试过的固定尺寸的框和步长依次对取样样本的字符进行切割,经调试后的框内只包括一个字,将框内的数据读取出来,转成图片保存,即切割出单个字体的图像,切割后随机选取图像作为需要扩充的风格字体的数据集,作为最终训练数据;
步骤3、将步骤2中得到的最终训练数据输入网络结构进行迭代和训练,并将网络输出得到的损失值输入优化器来更新编码器权重和解码器权重,以及量化隐向量的参数值;
步骤4、将单个训练样本和待扩展的汉字数据样本带入经步骤3更新的编码器和解码器中进行重构,得到进行风格扩充后的字体样本。
本发明的特点还在于:
步骤1和步骤2的具体过程为:
步骤1、首先在Word文档中输入m页固定字体风格的汉字,每个汉字之间插入空格;然后将该Word文档转成pdf格式;最后将pdf格式转成jpg格式图片,最终将得到m张图片,即为取样样本;
步骤2、对步骤1取样样本中的m张图片,通过调试过的固定尺寸的框和步长依次对每张图片的字符随机切割出i张、大小为c×r的图片,即得到m×i张、大小为c×r的图片,得到最终训练数据。
步骤3的具体过程为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安理工大学,未经西安理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911241906.1/2.html,转载请声明来源钻瓜专利网。