[发明专利]一种基于卷积自编码器的颜色恒常性方法有效
申请号: | 202110119635.3 | 申请日: | 2021-01-28 |
公开(公告)号: | CN112802137B | 公开(公告)日: | 2022-06-21 |
发明(设计)人: | 高绍兵;邱健珲;谭敏洁;彭舰 | 申请(专利权)人: | 四川大学 |
主分类号: | G06T9/00 | 分类号: | G06T9/00;G06T7/90;G06N3/04;G06N3/08 |
代理公司: | 北京正华智诚专利代理事务所(普通合伙) 11870 | 代理人: | 何凡 |
地址: | 610041 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 卷积 编码器 颜色 常性 方法 | ||
1.一种基于卷积自编码器的颜色恒常性方法,其特征在于,包括以下步骤:
S1、获取无色偏图像,并根据无色偏图像制作图像数据集;
S2、通过图像数据集对卷积自编码器进行训练,建立有色偏图像到无色偏图像的映射网络;
S3、通过映射网络实现图像的颜色恒常性;
所述步骤S1包括以下分步骤:
S11、在标准白光光源的场景中获取无色偏图像,并生成随机场景光源Ir=[Rr,Gr,Br],其中Rr,Gr,Br分别表示随机场景光源的R分量、G分量和B分量,其都是0和1之间满足标准正态分布的随机数;
S12、将随机场景光源Ir进行归一化后与原始无色偏图像进行合成,并乘以一个0和2之间满足标准正态分布的随机数以调整图像亮度,得到对应的有色偏图像;
S13、对所有无色偏图像采用步骤S12的方法进行处理,得到由无色偏图像以及其对应随机合成的有色偏图像所组成的图像数据集;
所述步骤S2中的卷积自编码器为一个n层全卷积神经网络,其中前n/2层为编码器部分,后n/2层为解码器部分,所述卷积自编码器的第i层通过跳跃连接设置连接至卷积自编码器的第n-i层,
所述步骤S2包括以下分步骤:
S21、采用随机裁剪对图像数据集进行数据增强,每次从有色偏图像中随机裁剪出大小为m×m的图像块x作为卷积自编码器的输入;
S22、将m×m的有色偏图像块x输入编码器部分,编码得到场景光源信息;
S23、将编码结果输入解码器部分进行解码,重构得到去除了光源的无色偏图像块A(x);
S24、根据无色偏图像块A(x)设置卷积自编码器的损失函数;
S25、根据损失函数,使用随机梯度下降与反向传播算法对卷积自编码器进行训练,建立有色偏图像到无色偏图像的映射网络;
所述步骤S24中卷积自编码器的损失函数L设置为:
其中Pt(x)表示有色偏图像块x所对应的无色偏图像块,A(x)表示卷积自编码器输出的去除了光源的无色偏图像块,Ir表示随机场景光源,IA(x)表示由A(x)和x计算得到的光源颜色,||·||1和||·||2分别表示1-范数和2-范数;
所述步骤S3包括以下分步骤:
S31、采用插值法将原始有色偏图像大小调整为m×m,得到输入图像;
S32、将输入图像输入至映射网络进行颜色校正,得到输出图像;
S33、对输出图像进行高斯滤波,并对滤波后的图像结果取RGB三通道的均值得到第一均值图像[RG,GG,BG];
S34、对输入图像的RGB三通道取均值得到第二均值图像[RO,GO,BO];
S35、将第一均值图像[RG,GG,BG]和第二均值图像[RO,GO,BO]相除得到估计光源
S36、使用估计光源值Ie对原始有色偏图像进行校正,得到最终的图像结果,实现图像的颜色恒常性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川大学,未经四川大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110119635.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种云计算环境下机密信息的存储方法
- 下一篇:一种消防机器人的隔热降温系统