[发明专利]基于强化学习的图像处理方法及模型训练方法、装置有效
申请号: | 202011035046.9 | 申请日: | 2020-09-27 |
公开(公告)号: | CN112200736B | 公开(公告)日: | 2021-07-20 |
发明(设计)人: | 杨幸潮;章佳杰;郑云飞;于冰 | 申请(专利权)人: | 北京达佳互联信息技术有限公司 |
主分类号: | G06T5/00 | 分类号: | G06T5/00;G06T5/40;G06T7/90;G06N3/04;G06N3/08 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 王英 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 强化 学习 图像 处理 方法 模型 训练 装置 | ||
1.一种基于强化学习的图像处理模型训练方法,所述图像处理模型包括第一网络以及第二网络,其特征在于,所述方法包括:
对目标样本图像进行特征提取,得到所述目标样本图像的特征图;
将所述图像特征分别输入所述第二网络和所述第一网络,得到所述第二网络输出的所述目标样本图像中各像素点的处理方式,以及所述第一网络输出的每个像素点的图像质量的期望累积反馈信息;
利用所述处理方式对所述目标样本图像进行处理后得到优化样本图像;
比较所述目标样本图像和所述优化样本图像,得到所述目标样本图像中每个像素点的图像质量的瞬时反馈信息,其中,对每个像素点,所述瞬时反馈信息是根据全局反馈信息和局部反馈信息得到的,所述全局反馈信息用于表示所述目标样本图像的图像质量的整体反馈信息,所述局部反馈信息用于表示所述像素点处的图像颜色的反馈信息;
采用各像素点的所述期望累积反馈信息和所述瞬时反馈信息训练所述第一网络和所述第二网络。
2.根据权利要求1所述的方法,其特征在于,所述图像处理模型还包括判别器网络,且所述第二网络和所述判别器网络构成对抗网络,所述方法还包括:
将所述目标样本图像和所述优化样本图像分别输入所述判别器网络,得到与所述目标样本图像对应的第一判别结果以及与所述优化样本图像对应的第二判别结果;
所述比较所述目标样本图像和所述优化样本图像,得到所述目标样本图像中每个像素点的图像质量的瞬时反馈信息中的全局反馈信息,包括:
确定所述第一判别结果和所述第二判别结果之间的差异度作为所述全局反馈信息。
3.根据权利要求1所述的方法,其特征在于,所述目标样本图像对应有配对图像,所述比较所述目标样本图像和所述优化样本图像,得到所述目标样本图像中每个像素点的图像质量的瞬时反馈信息中的局部反馈信息,包括:
对每个像素点,获取所述目标样本图像和所述优化样本图像中所述像素点的颜色值;
对所述像素点在所述目标样本图像和所述优化样本图像中的颜色值进行比较,得到所述像素点的颜色差异度作为所述像素点的所述局部反馈信息。
4.根据权利要求2所述的方法,其特征在于,所述判别器网络的训练集中包括所述目标样本图像以及非配对图像,所述非配对图像与所述目标样本图像的图像内容不同。
5.根据权利要求1所述的方法,其特征在于,所述第一网络的目标函数为:
其中,训练目标为不断缩小值;m×n表示述目标样本图像包括的总像素点数;γ表示预设的衰减系数;表示当前时间步时第(i,j)个像素点的累计瞬时反馈信息,表示下一时间步时第(i,j)个像素点的累计瞬时反馈信息;表示当前时间步第(i,j)个像素点的所述瞬时反馈信息;表示基于当前时间步得到的第(i,j)个像素点的所述期望累积反馈信息。
6.根据权利要求1所述的方法,其特征在于,所述第二网络的目标函数为:
其中,
其中,训练目标为不断缩小变小;m×n表示所述目标样本图像包括的总像素点数;γ表示预设的衰减系数;表示当前时间步第(i,j)个像素点的累计瞬时反馈信息;表示下一时间步时第(i,j)个像素点的累计瞬时反馈信息;表示当前时间步第(i,j)个像素点的瞬时反馈信息;表示当前时间步由所述第二网络得出的第(i,j)个像素点的处理方式的选择概率;表示基于当前时间步得到的第(i,j)个像素点的所述期望累积反馈信息。
7.根据权利要求1所述的方法,其特征在于,对每个像素点,根据以下方法确定所述像素点的瞬时反馈信息:
对所述像素点的所述全局反馈信息和所述局部反馈信息进行加权求和,得到所述像素点的瞬时反馈信息。
8.根据权利要求2所述的方法,其特征在于,所述判别器网络输出的判别结果的值域为连续取值区间。
9.根据权利要求1-8中任一所述的方法,其特征在于,所述第一网络和所述第二网络符合优势动作评论模式的框架要求。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京达佳互联信息技术有限公司,未经北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011035046.9/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序