[发明专利]一种基于深度学习的黑白影像自动着色方法有效

申请号：	201910234202.5	申请日：	2019-03-26
公开（公告）号：	CN111179361B	公开（公告）日：	2023-05-12
发明（设计）人：	黄昊明;全英汇;李郁青;陈少宏;周文浩;吕烜威;史孟鑫;袁铭泽	申请（专利权）人：	西安电子科技大学
主分类号：	G06T7/90	分类号：	G06T7/90
代理公司：	合肥市科融知识产权代理事务所(普通合伙) 34126	代理人：	王前程;王家培
地址：	710126 陕西省***	国省代码：	陕西;61
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于深度学习黑白影像自动着色方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明涉及一种基于深度学习的黑白影像自动着色方法，包括建立图片训练集、建立卷积神经网络训练网、卷积神经网络处理图像和着色结果修正。本发明的有益效果是：该基于深度学习的黑白影像自动着色方法通过对损失函数进行优化，增强了损失函数的鲁棒性，使得着色图片更加饱和，进一步增强图片着色后的对比度和清晰度，并且本发明借助自制的中国彩色电影数据集，我们有效地解决了在ImageNet数据集上训练时所遇到的泛红等问题，最终呈现出较好的效果。

技术领域

本发明涉及深度学习影像技术领域，具体为一种基于深度学习的黑白影像自动着色方法。

背景技术

随着科学技术的发展及时代的进步，目前较为流行的基于深度学习的着色方法，主要有两种：用户引导着色、数据驱动的自动着色，最初的用户引导着色技术是由Levin等人在2004年开创的，用户通过彩色画笔在灰度图像中进行引导性着色，随后优化算法会生成符合用户逻辑的着色结果，而数据驱动的自动着色研究重点为灰度图的自动着色，利用数据驱动对图像进行着色。

现有的用户引导着色方法在着色过程中仍然需要进行人机交互，无法完全实现智能化，并且存在效率低下等诸多弊端，并且现有的数据驱动的自动着色方法用的ImageNet数据集在训练过程中，数据集内大多为室外场景的图像，对于室内场景进行着色时，效果较差，容易出现整张图片泛红的情况、数据集过于庞大，其中一些数据，例如猫狗的照片对于训练网络并没有帮助，且训练起来对硬件和时间成本要求较高及数据集中图片分辨率不统一，对于提高网络的泛化能力有一定帮助，但对于专注于某一类别图像的神经网络来说，作用并不明显，并且容易增大学习误差，同时，损失函数对于着色问题的固有的模糊性还有多模态性不是很鲁棒，存在不足。

发明内容

本发明的目的在于提供一种基于深度学习的黑白影像自动着色方法，以解决上述背景技术中提出的问题。

为实现上述目的，本发明提供如下技术方案：一种基于深度学习的黑白影像自动着色方法，包括建立图片训练集、建立卷积神经网络训练网、卷积神经网络处理图像和着色结果修正。

优选的，所述建立图片训练集：用于将训练图原图转换到HSV空间，并使图中S的通道值保持不变，通过修改图中H与V的通道值，依次产生和该训练图相对应的不同配色、不同明度的生成图，再将原图与生成图集中成一组图像训练数据，并将其分辨率统一为640*480。

优选的，所述建立卷积神经网络训练网：将导入图像从RGB空间转换到LAB空间，在此基础上，使L通道里的信息保持不变，而AB两个通道的内容进行如下的特殊变换：

将AB通道的输出空间以10为步长量化为Q＝310的类，对于给定的输入K，学习一个颜色概率分布的映射之后，使用多分类交叉熵作为损失函数。

优选的，所述卷积神经网络处理图像:将导入图像与目标图像进行抽取色卡的操作，并对导入图像与目标图像上的点进行随机采样。然后，将导入图像、导入图像的采样、导入图像的色卡作为卷积神经网络的输入，将生成的结果通过一个卷积层产生新的L通道和AB通道里的信息，并将生成图像的通道合并制成新图像，把新图像与目标图像的色卡、目标图像的采样进行对比，计算误差，再将其放入回馈网络进行训练，直至误差足够小时停止。

优选的，所述着色结果修正：在指定区域，指定其灰度图上一个点，在调色板上对该点及其周围颜色进行更换，神经网络依据颜色更换提示再次对图像变色，重复以上步骤，直至满意时停止。

与现有技术相比，具备以下有益效果：通过对损失函数进行优化，增强了损失函数的鲁棒性，使得着色图片更加饱和，进一步增强图片着色后的对比度和清晰度，并且本发明借助自制的中国彩色电影数据集，我们有效地解决了在ImageNet数据集上训练时所遇到的泛红等问题，最终呈现出较好的效果，同时，本发明除了传统的卷积层，我们在其中添加了Inception-ResNet-V2架构，且该架构由Inception模块和残差网共同组成，有效的提高了网络对图像特征提取的效率。

附图说明

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于西安电子科技大学，未经西安电子科技大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201910234202.5/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06T 一般的图像数据处理或产生
G06T7-00 图像分析，例如从位像到非位像
G06T7-20 .运动分析
G06T7-40 .结构分析
G06T7-60 .图形属性的分析，例如一个图像的区域、重心、周边

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于深度学习的黑白影像自动着色方法有效

专利文献下载