[发明专利]改进FANnet生成网络的图像字符编辑方法有效
申请号: | 202110525020.0 | 申请日: | 2021-05-12 |
公开(公告)号: | CN113158977B | 公开(公告)日: | 2022-07-29 |
发明(设计)人: | 刘尚旺;李名;刘国奇;袁培燕;孙林 | 申请(专利权)人: | 河南师范大学 |
主分类号: | G06V30/32 | 分类号: | G06V30/32;G06V30/148;G06V10/56;G06V30/18;G06V10/82;G06N3/04;G06N3/08 |
代理公司: | 河南大象律师事务所 41129 | 代理人: | 王映朴 |
地址: | 453000*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 改进 fannet 生成 网络 图像 字符 编辑 方法 | ||
1.改进FANnet生成网络的图像字符编辑方法,其特征在于,所述方法包括以下步骤:
(1)从图像中选择欲替换的源字母,并通过HC显著性检测算法和自定义阈值分割算法的自适应目标检测模型提取源字母的二值图;
(2)通过FANnet生成网络生成与源字符字体结构一致的目标字符二值图;
(3)通过基于颜色复杂度的自适应局部颜色迁移模型对已得目标二值图进行颜色迁移后将源字母替换为生成字母;
步骤(1)中自适应目标检测模型为:
Δ(T)=Sr(THC)-Sr(TB) (7)
式中,IHC代表原图I经过HC算法处理后的二值图;IB代表区域Ω的二值图,T代表区域Ω内的一个连通分量,Sr(.)代表对区域Ω经过源字母提取后的最小边界框,BT为连通分量的最小边界值;
源字母二值图定义为:
图像If包含选定区域Ω内所有的字母二值图,IM代表原图I经过MSER算法处理后得到的二值图;⊙代表矩阵的元素积;
局部色彩迁移模型的算法为:
建立计算Iθ的非零边框得到通过元素点乘操作后得到具有颜色特征的源字母显著图:
色彩复杂度判别算法为:
S为源字符颜色复杂度,γ为判别因子,定义为0.28,M代表在Nc中随机选择fcolor×N个颜色,N代表中不同颜色的数目,fcolor定义为0.1,n代表像素点P在RGB通道的值,且满足Pn=max(Nc),Nc定义为中颜色c出现的次数,Dissimlar(.)表示空间颜色距离,当且仅当Pn与Pi为相似色时计数加一,当源字母被判定为纯色时,仅对目标字母进行纯色迁移;
当源字母被判定为非纯色时,提取中源字母内的颜色特征,采用双线性差值法对源字母内含有颜色特征信息的区域依次进行处理,从而得到颜色掩码:
定义Icolor为大小与目标字母二值图相同尺寸的零图,然后对图像逐行进行颜色提取,即当像素点值pcolor=0时删除该像素点,否则保留,将颜色提取后的第i行记为Rowi,Ti(.)代表对Rowi进行双线性插值操作,其中:
ycolor对应颜色掩码Icolor第i行中像素点坐标,对应Rowi中像素点坐标,且存在映射关系:
wcolor,分别为Icolor和Rowi的宽度,u,v分别为计算得到和ycolor的小数部分,最后进行颜色迁移操作:
式中,Icolor表示颜色掩码图,Bterget表示目标字母的二值图,⊙表示矩阵元素内积;
字体自适应生成神经网络,即FANnet生成网络含有两个不同的输入,分别是尺寸为64×64的源字母二值图和目标字母的标签,在网络的编码部分,输入的源字母图像通过滤波器分别为16、16和1的3个卷积层,随后经过全连接层FC1,独热编码v经过全连接层FC2,通过维度变换,将FC1和FC2的输出均转化为512维的潜在表示,并将其连接作为全连接层FC3和FC4的输入,全连接层FC3和FC4均含有1024个神经元,网络的解码部分将FC4输出的特征向量尺寸转换为8×8×16,后依次经过3个滤波器为16、16和1的反卷积层,每一个反卷积层包括一次上采样操作和一个2D卷积,所有的卷积层使用3×3的卷积核,后连接一个ReLU的激活函数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河南师范大学,未经河南师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110525020.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:烹饪装置
- 下一篇:一种用于梨外观品质视觉分级方法及分级生产线