[发明专利]一种新型的字体特效渲染方法有效
申请号: | 201910602122.0 | 申请日: | 2019-07-05 |
公开(公告)号: | CN110310225B | 公开(公告)日: | 2023-06-16 |
发明(设计)人: | 帅仁俊;徐泽;刘开凯 | 申请(专利权)人: | 南京工业大学 |
主分类号: | G06T3/00 | 分类号: | G06T3/00 |
代理公司: | 南京知识律师事务所 32207 | 代理人: | 朱少华 |
地址: | 211816 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 新型 字体 特效 渲染 方法 | ||
本发明涉及一种新型的字体特效渲染方法,包括如下步骤:随机初始化生成图片,即随机选取像素的白噪声图并作为VGG‑19的输入;在VGG‑19的conv4_2层提取字体图片的高维度内容特征点,并计算生成图片与字体图片的最强引力内容损失;在VGG‑19的conv3_2和conv4_2层提取风格图片的高维度风格特征点,并计算生成图片与风格图片的最强引力风格损失;求出最强引力整体损失函数;最小化总体损失函数的值;如果该值收敛或小于指定阈值,则停止迭代;否则转步骤二。本发明的字体特效渲染方法采用最强引力的方法能够减少现有技术中字体渲染过程中渲染风格不彻底以及渲染区域选择错误等问题出现的概率。
技术领域
本发明涉及计算机技术领域,尤其涉及一种新型的字体特效渲染方法。
背景技术
近年来,人工智能已经成为科技圈最热门的技术之一。随着人工智能技术的逐渐成熟,深度学习开始在图像处理领域发力。在一些大规模的图像识别竞赛中,一些基于深度学习的算法转露头角。卷积神经网络(Convolutional Neural Network,CNN)是深度学习技术中极具代表性的网络结构之一,比以往的图像处理方法更加高效和优越。传统字体特效的设计过程通常是由人工完成,这耗费了大量的人力物力。人工设计的艺术字还还有一个缺点,设计出来的某一特定字体的风格不能迁移到另一个字体上。在深度学习的应用中,卷积神经网络可以作为一种生成网络,用来生成非真实图片,字体特效渲染就是其中一个重要应用。卷积神经网络可以学习到图片的特效风格,创作出具有艺术魅力的特效字体。
基于深度学习的字体特效渲染算法取得了很好的纹理合成效果,并运用卷积神经网络将一张图像的纹理迁移到另一张字体图片上。在渲染过程中,使用卷积神经网络和Gram矩阵会使图片丢失一些低层次的信息,所以该算法在保持精细结构和细节连贯性上表现不佳,无法表现出照片级真实感。具有完全不同均值和方差的特征拥有同样的Gram矩阵,这导致了渲染效果不理想。在原有的基础上额外的添加了梯度直方图进行约束,通过更少的迭代次数达到了更稳定的渲染效果,但在细节连贯性方面有所欠缺。神经风格迁移技术目前使用较多的损失函数有L1、L2和Gram损失,前两者是逐像素损失函数,后者是全局损失函数。在字体特效渲染任务中,这些损失函数的使用会出现很多问题,其中主要出现的问题是字体特效渲染不彻底、渲染图像空间扭曲以及渲染区域选择错误。
发明内容
针对字体特效渲染任务中的风格渲染不彻底和渲染区域错误的问题,本发明提出了一种基于语义学的最强引力的方法,并设计了最强引力损失函数替换原算法中的逐像素损失和全局损失函数。
本发明的具体内容如下:一种新型的字体特效渲染方法,包括如下步骤:
步骤一:随机初始化生成图片g,即随机选取像素的白噪声图并作为VGG-19的输入;
步骤二:在VGG-19的conv4_2层提取字体图片c的高维度内容特征点,并计算生成图片g与字体图片c的最强引力内容损失LMG(g,c,lc),其中lc为VGG-19的conv4_2层的输出;
步骤三:在VGG-19的conv3_2和conv4_2层提取风格图片s的高维度风格特征点,并计算生成图片g与风格图片s的最强引力风格损失LMG(g,s,ls);
步骤四:求出最强引力整体损失函数Ltotal;
步骤五:最小化总体损失函数Ltotal的值;
步骤六:如果Ltotal收敛或小于指定阈值,则停止迭代;否则转步骤二;
其中,步骤二和步骤三可互换顺序。
进一步的,步骤一中初始化的生成图片g为一般字体图片。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京工业大学,未经南京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910602122.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:光效渲染方法及装置
- 下一篇:图片的拼接显示方法及系统