[发明专利]一种基于深度学习的黑白影像自动着色方法有效
申请号: | 201910234202.5 | 申请日: | 2019-03-26 |
公开(公告)号: | CN111179361B | 公开(公告)日: | 2023-05-12 |
发明(设计)人: | 黄昊明;全英汇;李郁青;陈少宏;周文浩;吕烜威;史孟鑫;袁铭泽 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06T7/90 | 分类号: | G06T7/90 |
代理公司: | 合肥市科融知识产权代理事务所(普通合伙) 34126 | 代理人: | 王前程;王家培 |
地址: | 710126 陕西省*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 黑白 影像 自动 着色 方法 | ||
本发明涉及一种基于深度学习的黑白影像自动着色方法,包括建立图片训练集、建立卷积神经网络训练网、卷积神经网络处理图像和着色结果修正。本发明的有益效果是:该基于深度学习的黑白影像自动着色方法通过对损失函数进行优化,增强了损失函数的鲁棒性,使得着色图片更加饱和,进一步增强图片着色后的对比度和清晰度,并且本发明借助自制的中国彩色电影数据集,我们有效地解决了在ImageNet数据集上训练时所遇到的泛红等问题,最终呈现出较好的效果。
技术领域
本发明涉及深度学习影像技术领域,具体为一种基于深度学习的黑白影像自动着色方法。
背景技术
随着科学技术的发展及时代的进步,目前较为流行的基于深度学习的着色方法,主要有两种:用户引导着色、数据驱动的自动着色,最初的用户引导着色技术是由Levin等人在2004年开创的,用户通过彩色画笔在灰度图像中进行引导性着色,随后优化算法会生成符合用户逻辑的着色结果,而数据驱动的自动着色研究重点为灰度图的自动着色,利用数据驱动对图像进行着色。
现有的用户引导着色方法在着色过程中仍然需要进行人机交互,无法完全实现智能化,并且存在效率低下等诸多弊端,并且现有的数据驱动的自动着色方法用的ImageNet数据集在训练过程中,数据集内大多为室外场景的图像,对于室内场景进行着色时,效果较差,容易出现整张图片泛红的情况、数据集过于庞大,其中一些数据,例如猫狗的照片对于训练网络并没有帮助,且训练起来对硬件和时间成本要求较高及数据集中图片分辨率不统一,对于提高网络的泛化能力有一定帮助,但对于专注于某一类别图像的神经网络来说,作用并不明显,并且容易增大学习误差,同时,损失函数对于着色问题的固有的模糊性还有多模态性不是很鲁棒,存在不足。
发明内容
本发明的目的在于提供一种基于深度学习的黑白影像自动着色方法,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:一种基于深度学习的黑白影像自动着色方法,包括建立图片训练集、建立卷积神经网络训练网、卷积神经网络处理图像和着色结果修正。
优选的,所述建立图片训练集:用于将训练图原图转换到HSV空间,并使图中S的通道值保持不变,通过修改图中H与V的通道值,依次产生和该训练图相对应的不同配色、不同明度的生成图,再将原图与生成图集中成一组图像训练数据,并将其分辨率统一为640*480。
优选的,所述建立卷积神经网络训练网:将导入图像从RGB空间转换到LAB空间,在此基础上,使L通道里的信息保持不变,而AB两个通道的内容进行如下的特殊变换:
将AB通道的输出空间以10为步长量化为Q=310的类,对于给定的输入K,学习一个颜色概率分布的映射之后,使用多分类交叉熵作为损失函数。
优选的,所述卷积神经网络处理图像:将导入图像与目标图像进行抽取色卡的操作,并对导入图像与目标图像上的点进行随机采样。然后,将导入图像、导入图像的采样、导入图像的色卡作为卷积神经网络的输入,将生成的结果通过一个卷积层产生新的L通道和AB通道里的信息,并将生成图像的通道合并制成新图像,把新图像与目标图像的色卡、目标图像的采样进行对比,计算误差,再将其放入回馈网络进行训练,直至误差足够小时停止。
优选的,所述着色结果修正:在指定区域,指定其灰度图上一个点,在调色板上对该点及其周围颜色进行更换,神经网络依据颜色更换提示再次对图像变色,重复以上步骤,直至满意时停止。
与现有技术相比,具备以下有益效果:通过对损失函数进行优化,增强了损失函数的鲁棒性,使得着色图片更加饱和,进一步增强图片着色后的对比度和清晰度,并且本发明借助自制的中国彩色电影数据集,我们有效地解决了在ImageNet数据集上训练时所遇到的泛红等问题,最终呈现出较好的效果,同时,本发明除了传统的卷积层,我们在其中添加了Inception-ResNet-V2架构,且该架构由Inception模块和残差网共同组成,有效的提高了网络对图像特征提取的效率。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910234202.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:EGFR抑制剂及其制备和应用
- 下一篇:一种呼吸运动建模方法、装置和系统