[发明专利]一种基于深度残差网络的可交互图像着色在审

专利信息
申请号: 201910540110.X 申请日: 2019-06-21
公开(公告)号: CN110322530A 公开(公告)日: 2019-10-11
发明(设计)人: 肖懿;朱贤益;周佩瑶 申请(专利权)人: 湖南大学
主分类号: G06T11/40 分类号: G06T11/40;G06N3/04
代理公司: 暂无信息 代理人: 暂无信息
地址: 410082 湖*** 国省代码: 湖南;43
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 着色 残差 着色效果 交互图像 网络 卷积神经网络 图像处理领域 残差图像 单独使用 灰度图像 模型设计 神经网络 输出相关 输入灰度 输入颜色 损失函数 图像着色 网络模型 网络输出 优化图像 彩色点 灰度图 梯度图 学习 修正
【权利要求书】:

1.一种基于深度残差学习的可交互图像着色方法,其特征在于,包括如下两个步骤:

步骤1、基于卷积神经网络的着色网络模型的设计;

步骤2、同时或单独实现两种着色方法的损失函数的设计;

步骤3、基于残差学习思想的残差神经网络模块的设计。

2.根据权利要求1所述的基于深度残差学习的可交互图像着色方法,其特征在于,步骤1中,基于卷积神经网络的着色网络模型的设计,具体包括如下两个步骤:

步骤2.1、基于深度学习相关的已有成果,选择卷积神经网络作为着色网络,输入通过卷积、下采样、上采样等操作最终输出ab通道,其中通过扩张卷积层扩大感受野。

步骤2.2、根据着色需要,确定网络模型的输入包括图像的L通道(灰度图)、L通道梯度图、颜色主题输入、彩色点输入,其中L通道梯度图用来优化边界颜色溢出的情况,颜色主题和彩色点作为两种着色方法的输入。

3.根据权利要求1所述的基于深度残差学习的可交互图像着色方法,其特征在于,步骤2中,基于卷积神经网络的着色模型,其损失函数包括如下部分:

步骤3.1、通过计算真实图像与输出图像之间的Huber函数,来约束输出的ab通道趋近于真实图像的ab通道:

步骤3.2、通过K-means算法,得到真实图像中数量最多的3-5种颜色,形成着色用的颜色主题,并且将每个像素映射到最接近的颜色,形成颜色映射图,通过计算颜色映射图与输出图像之间的Huber函数,来约束输出图像的ab通道趋近于颜色主题中的颜色:

步骤3.3、通过Sobel算法,可以得到图像的梯度图,通过计算真实图像的梯度图和输出图像的梯度图之间的MSE,来约束输出图像的纹理等信息进一步趋向于真实图像:

所以最终的损失函数为:

其中,在α1=0.9,α2=0.1,α3=10时取得最好效果。

4.根据权利要求1所述的基于深度残差学习的可交互图像着色方法,其特征在于,步骤3中,基于残差学习思想的残差模块的设计,具体包括如下部分:

步骤4.1、将步骤3中的着色网络的输出与灰度图融合,通过8层残差网络后,得到ab通道的残差结果,将其与着色网络的输出融合,对其进行修正,得到具有更多原图细节的图像。

步骤4.2、通过计算残差网络模块的输出与真实图像之间的差值,约束最终输出的ab通道趋近于真实图像的ab通道。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南大学,未经湖南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910540110.X/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top