[发明专利]一种基于深度本征分解的图像编辑方法及系统在审
申请号: | 202111034088.5 | 申请日: | 2021-09-03 |
公开(公告)号: | CN113936182A | 公开(公告)日: | 2022-01-14 |
发明(设计)人: | 刘越;沙浩;宋维涛;王涌天 | 申请(专利权)人: | 北京理工大学 |
主分类号: | G06V10/774 | 分类号: | G06V10/774;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京理工大学专利中心 11120 | 代理人: | 李爱英 |
地址: | 100081 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 分解 图像编辑 方法 系统 | ||
1.一种基于深度本征分解的图像编辑方法,其特征在于,具体步骤包括:
将待编辑图像进行预处理,作为输入图像;
基于卷积神经网络,构建本征图像分解模型,所述本征图像分解模型接收所述输入图像之后,首先利用输入卷积层进行卷积扩充,进而利用编码器网络对卷积扩充的结果进行编码,然后利用解码器网络通过卷积和反卷积将编码后的图像的特征逐步上采样,恢复到所述输入图像的大小,最后采用输出卷积层输出一个阴影图和一个反射率图;
对所述本征图像分解模型输出的阴影图和反射率图分别进行自定义编辑,并将自定义编辑后的阴影图和反射率图进行重建并输出,得到针对所述待编辑图像的自定义编辑结果。
2.如权利要求1所述的方法,其特征在于,所述将待编辑图像进行预处理,具体方法为:
将所述待编辑图像的长和宽缩放成32的倍数。
3.如权利要求2所述的方法,其特征在于,所述本征图像分解模型具体为:
所述本征图像分解模型中包含一个输入卷积层、阴影图编码器网络、阴影图解码器网络、反射率图编码器网络、反射率图解码器网络以及一个输出卷积层;
所述输入卷积层接收所述输入图像之后,对所述输入图像进行卷积扩充,扩充成为32个通道的图像,扩充后的图像复制为两份,一份进入到阴影图编码器网络,另一份进入到反射率图编码器网络;
所述阴影图编码器网络包含阴影图共享编码器、阴影图独立编码器以及阴影图独立解码器;其中所述阴影图共享编码器顺次包含五层相同的阴影图共享编码层,顺次针对扩充后的图像添加五层阴影图共享编码,添加阴影图共享编码的图像输入至阴影图独立编码器;所述阴影图独立编码器顺次包含四层阴影图独立编码层,顺次对添加阴影图共享编码的图像添加四层阴影图独立编码,添加阴影图独立编码的图像输入至阴影图解码器网络;
所述阴影图解码器网络包含阴影图独立解码器,所述阴影图独立解码器顺次包含四层阴影图独立解码层,针对添加阴影图独立编码的图像进行四层阴影图独立解码,阴影图独立解码的过程是通过卷积与反卷积将阴影图独立编码的图像的特征逐步上采样,直至恢复到输入图像大小,得到阴影图独立解码后的图像送入所述输出卷积层;
所述输出卷积层通过1*1的卷积将阴影图独立解码后的图像恢复为阴影图;
所述反射率图编码器网络包含反射率图共享编码器、反射率图独立编码器以及反射率图独立解码器;其中所述反射率图共享编码器顺次包含五层相同的反射率图共享编码层,顺次针对扩充后的图像添加五层反射率图共享编码,添加反射率图共享编码的图像输入至反射率图独立编码器;所述反射率图独立编码器顺次包含四层反射率图独立编码层,顺次对添加反射率图共享编码的图像添加四层反射率图独立编码,添加反射率图独立编码的图像输入至反射率图解码器网络;
所述反射率图解码器网络包含反射率图独立解码器,所述反射率图独立解码器顺次包含四层反射率图独立解码层,针对添加反射率图独立编码的图像进行四层反射率图独立解码,反射率图独立解码的过程是通过卷积与反卷积将反射率图独立编码的图像的特征逐步上采样,直至恢复到输入图像大小,得到反射率图独立解码后的图像送入所述输出卷积层;
所述输出卷积层通过1*1的卷积将反射率图独立解码后的图像恢复为反射率图。
4.如权利要求3所述的方法,其特征在于,所述将自定义编辑后的阴影图和反射率图进行重建并输出,具体方法为:
自定义编辑后的阴影图和自定义编辑后的反射率对应像素位置进行逐像素相乘,获得编辑后的输入图像。
5.如权利要求1所述的方法,其特征在于,在构建完本征图像分解模型后,还包括对所述本征图像分解模型进行训练,具体训练方式为:
采用CGI数据集和真实数据集进行训练;
对于CGI数据集,使用尺寸不变损失函数和重建损失函数对所述本征图像分解模型进行训练;对于真实数据集,使用铰链损失函数、重建损失函数和局部平滑损失函数对所述本征图像分解模型进行训练。
6.如权利要求5所述的方法,其特征在于,在所述训练方式中,采用自适应梯度下降法进行训练,设置学习率为0.00005,小批量数目为4。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111034088.5/1.html,转载请声明来源钻瓜专利网。