[发明专利]一种编解码网络的训练方法、装置、设备及存储介质有效
申请号: | 202110303982.1 | 申请日: | 2021-03-22 |
公开(公告)号: | CN112929666B | 公开(公告)日: | 2023-04-14 |
发明(设计)人: | 任文龙;倪煜 | 申请(专利权)人: | 北京金山云网络技术有限公司 |
主分类号: | H04N19/172 | 分类号: | H04N19/172;H04N19/42;H04N19/44;H04N19/147 |
代理公司: | 北京华夏泰和知识产权代理有限公司 11662 | 代理人: | 刘蔓莉 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 解码 网络 训练 方法 装置 设备 存储 介质 | ||
本申请公开了一种编解码网络的训练方法、装置、设备及存储介质。该方法包括:在执行每轮训练时,获取样本图像;将样本图像输入编解码网络,利用编解码网络对样本图像顺序执行压缩编码处理和解码恢复处理,得到样本图像对应的解码图像;根据样本图像和样本图像对应的解码图像,确定编解码网络对应的图像损失值和解码损失值;根据编解码网络对应的图像损失值和解码损失值,确定编解码网络对应的网络损失值;在经过多轮训练,编解码网络对应的网络损失值处于预设的网络收敛范围时,确定编解码网络收敛。本申请确保解码图像清晰度的同时,控制解码图像的失真情况,恢复出的图像质量较高,无需使用修复网络对解码图像进行修复。
技术领域
本申请涉及数据处理技术领域,尤其涉及一种编解码网络的训练方法、装置、设备及存储介质。
背景技术
随着智能设备的普及,越来越多的图像被生产出来,高分辨率的图像往往数据量较大,无论在存储场景中,还是在传输场景中,大数据量的图像都会占用较多的资源(存储空间,传输资源)。为了解决这种问题,图像压缩技术应运而生。利用图像压缩技术对原始图像进行图像编码,可以将原始图像压缩为较小数据量的压缩数据,再对压缩数据进行图像解码,还可以将压缩数据恢复为原始图像。
目前,常用的图像压缩技术为WebP图像压缩技术和BPG(Better PortableGraphics,更好的可移植图形)图像压缩技术。WebP支持有损压缩和无损压缩,采用VP8编码方式,很多网站都已采用WebP图片格式。BPG为收费项目,使用费用很高,BPG采用HEVC(HighEfficiency Video Coding,高效率视频编码)编码方式,在相同的存储体积下,BPG格式的文件只有JPEG(Joint Photographic Experts Group,联合图像专家组)格式的文件的一半。
但是,WebP图像压缩技术和BPG图像压缩技术仅考虑如何将图像压缩为小数据量的压缩数据,都没有考虑到如何避免图像恢复过程中失真严重的问题,导致恢复出的原始图像质量不高。
发明内容
本申请提供了一种编解码网络的训练方法、装置、设备及存储介质,以解决现有图像压缩技术在图像恢复时出现的图像失真问题。
针对上述技术问题,本申请是通过以下技术方案来实现的:
本申请实施例提供了一种编解码网络的训练方法,包括:在执行每轮训练时,获取样本图像;将所述样本图像输入编解码网络,利用所述编解码网络对所述样本图像顺序执行压缩编码处理和解码恢复处理,得到所述样本图像对应的解码图像;根据所述样本图像和所述样本图像对应的解码图像,确定所述编解码网络对应的图像损失值和解码损失值;根据所述编解码网络对应的图像损失值和解码损失值,确定所述编解码网络对应的网络损失值;在经过多轮训练,所述编解码网络对应的网络损失值处于预设的网络收敛范围时,确定所述编解码网络收敛。
其中,所述根据所述样本图像和所述样本图像对应的解码图像,确定所述编解码网络对应的解码损失值,包括:将所述样本图像和所述样本图像对应的解码图像输入预设的增强网络;通过所述增强网络确定所述样本图像的失真率和所述样本图像对应的解码图像的失真率;根据所述样本图像的失真率和所述解码图像的失真率,确定所述编解码网络对应的解码损失值。
其中,所述获取样本图像,包括:获取至少一个样本图像;所述将所述样本图像输入编解码网络,利用所述编解码网络对所述样本图像顺序执行压缩编码处理和解码恢复处理,得到所述样本图像对应的解码图像,包括:生成所述至少一个样本图像对应的样本图像矩阵;所述样本图像矩阵中的每一行向量为一个一维的所述样本图像;将所述样本图像矩阵输入所述编解码网络,利用所述图像编码网络对所述样本图像矩阵顺序执行压缩编码处理和解码恢复处理,得到解码图像矩阵;其中,所述解码图像矩阵中的每一行向量为一个所述样本图像对应的一维的解码图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京金山云网络技术有限公司,未经北京金山云网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110303982.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:3D芯片的存储器修复方法及相关设备
- 下一篇:一种普外科医生用手术止血装置