[发明专利]一种目标边缘清晰化的风格迁移方法有效
申请号: | 202010807580.0 | 申请日: | 2020-08-12 |
公开(公告)号: | CN111986075B | 公开(公告)日: | 2022-08-09 |
发明(设计)人: | 沈瑜;杨倩;吴亮;张泓国;王霖;梁丽;王海龙;李丹丹 | 申请(专利权)人: | 兰州交通大学 |
主分类号: | G06T3/00 | 分类号: | G06T3/00;G06T5/50;G06N3/08;G06N3/04 |
代理公司: | 北京金宏来专利代理事务所(特殊普通合伙) 11641 | 代理人: | 许振强 |
地址: | 730070 甘肃*** | 国省代码: | 甘肃;62 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 目标 边缘 清晰 风格 迁移 方法 | ||
本发明涉及图像处理领域,具体为一种目标边缘清晰化的风格迁移方法,实现步骤为:搭建深度神经抠图网络;对原始风格图像和原始内容图像进行特征图提取、风格图像重建和内容图像重建;优化风格图像和内容图像产生的损失函数;计算原始风格图像与提取的内容图像特征图之间的欧氏距离;计算原始风格图像与提取的风格图像特征图之间的均方误差;确定风格图像与原始风格图像和内容图像的总损失函数;将总损失函数计算的误差进行迭代更新,并输出风格图像。本发明实现了风格图像的结构约束、纹理合成以及风格类似的图像之间的参数共享。
技术领域
本发明涉及图像处理领域,具体为一种目标边缘清晰化的风格迁移方法。
背景技术
图像艺术风格渲染是计算机视觉领域中重要的研究方向。图像艺术风格化在电影产业、动画制作、游戏渲染等领域有着大量的应用。图像风格艺术化是指一幅图像的语义内容用另一幅图像的风格去表示。传统的风格迁移方法大多为手动建模,需要专业经验和复杂的数学公式,且语义内容保留以及空间约束性较差。深度神经网络凭借其强大的图像表示能力,迅速成为一种流行的图像风格化工具,推动了近年来许多神经样式转移方法的发展。因此,一种高效准确的图像风格化算法来提取图像风格及内容,能使风格化后的图像的主要目标清晰可辨且风格化效果显著。图像迁移过程中,图像布局被破坏并且前景、背景以及其他物体之间的边界变得模糊,图像的语义内容和空间布局保留程度有限,生成的图像目标模糊,视觉效果不够理想。
发明内容
针对图像布局被破坏并且前景、背景以及其他物体之间的边界变得模糊,生成图像的风格颜色中会掺杂风格图像中没有的颜色,图像的语义内容和空间布局保留程度有限,生成的图像会产生扭曲的问题,本发明提出了一种目标边缘清晰化的风格迁移方法,实现风格图像的结构约束、纹理合成以及风格类似的图像之间的参数共享。
为了实现所述目的,本发明采用的具体实施方案如下:
一种目标边缘清晰化的风格迁移方法,包括:
S1.输入原始风格图像和原始内容图像,搭建深度神经抠图网络;
S2.对原始风格图像和原始内容图像进行特征图提取、风格图像重建和内容图像重建,并将抠图网络产生的遮罩与重建的风格图像和内容图像合并;
S3.将特征图和抠图网络产生的遮罩叠加在高斯白噪声图像上,优化风格图像和内容图像产生的损失函数;
S4.计算原始风格图像与提取的内容图像特征图之间的欧氏距离;计算原始风格图像与提取的风格图像特征图之间的均方误差;
S5.将欧氏距离和均方误差与约束函数按照权重叠加,得到原始风格图像和原始内容图像与风格图像的总损失函数;
S6.将误差进行迭代更新,并输出风格图像。
所述深度神经抠图网络的搭建采用编码器-解码器结构,解码器的卷积层使用小卷积核,编码器部分由VGG-19模型作为特征提取器。
所述深度神经抠图网络最后一层是具有sigmoid函数的1×1的卷积层,该卷积层的特征图通道数为1,元素阈值设为[0,1]。
所述S2还包括:
S201、用VGG-19网络的卷积层Conv4_2和Conv5_2提取的高维特征图进行内容表示;
S2022、用VGG-19网络的卷积Conv1_1,Conv2_1,Conv3_1,Conv4_1,Conv5_1提取的特征图进行风格表示。
所述S3中,内容图像x和风格化图像在第l层的损失函数为
风格图像y和风格化图像在第l层的损失函数为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于兰州交通大学,未经兰州交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010807580.0/2.html,转载请声明来源钻瓜专利网。