[发明专利]基于深度学习的人脸图像压缩方法及装置有效
申请号: | 202010925736.5 | 申请日: | 2020-09-04 |
公开(公告)号: | CN112053408B | 公开(公告)日: | 2021-05-25 |
发明(设计)人: | 段一平;陶晓明;胡舒展;刘永嘉;张栩铭;陆建华 | 申请(专利权)人: | 清华大学 |
主分类号: | G06T9/00 | 分类号: | G06T9/00;G06T7/529;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 安卫静 |
地址: | 10008*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 学习 图像 压缩 方法 装置 | ||
本发明提供了一种基于深度学习的人脸图像压缩方法及装置,涉及图像处理的技术领域,包括:先基于平均人脸图像和主动外观模型,将测试人脸图像分解为形状分量和纹理分量;然后利用量化熵编码器对形状分量进行编码压缩,得到第一压缩结果;再利用训练好的卷积神经网络编码器对纹理分量进行编码压缩,得到第二压缩结果;最后将第一压缩结果和第二压缩结果确定为人脸图像压缩结果。本发明将平均人脸图像和主动外观模型作为先验知识,且采用训练好的卷积神经网络编码器对纹理分量进行编码压缩的方式可以得到低维度特征表示的第二压缩结果,降低了纹理分量的冗余度,提高了人脸图像的压缩效率。
技术领域
本发明涉及图像处理技术领域,尤其是涉及一种基于深度学习的人脸图像压缩方法及装置。
背景技术
随着互联网技术的发展,以视频为主体的移动多媒体数据急剧增长,超过5G带宽增速,导致超高清视频业务面临研究挑战。在目前或者可见的将来,信息产生的体量和对应的传输技术在增长速度上会产生一定程度的脱节。数据规模的不断扩张,使其与无线带宽资源之间的矛盾日益突出。在全球新冠疫情期间,远程诊疗、远程探视、远程会议、远程办公等已经悄然成为常态,而人脸图像是相关业务的主要载体,目前大多采用JPEG 2000视频编码标准进行人脸图像压缩,由于采用JPEG 2000标准处理算法比较复杂,因此其处理每一帧人脸图像的时间较长,因而大幅提升人脸图像压缩效率仍然是难题。
发明内容
本发明的目的在于提供一种基于深度学习的人脸图像压缩方法及装置,以缓解现有技术中存在的压缩复杂度高、人脸图像压缩效率较低的技术问题。
第一方面,本发明提供的一种基于深度学习的人脸图像压缩方法,其中,包括:基于平均人脸图像和主动外观模型,将测试人脸图像分解为形状分量和纹理分量;利用量化熵编码器对所述形状分量进行编码压缩,得到第一压缩结果;利用训练好的卷积神经网络编码器对所述纹理分量进行编码压缩,得到第二压缩结果;将所述第一压缩结果和第二压缩结果确定为人脸图像压缩结果。
进一步的,基于平均人脸图像和主动外观模型,将测试人脸图像分解为形状分量和纹理分量,包括:获取平均人脸图像的预设标志点坐标;将所述测试人脸图像输入至所述主动外观模型,得到测试人脸图像的面部标志点坐标;基于所述测试人脸图像的面部标志点坐标和所述平均人脸图像的预设标志点坐标,确定测试人脸图像的预设标志点坐标;基于测试人脸图像的预设标志点坐标,确定所述形状分量;基于所述形状分量与纹理分量之间的预设关系和所述形状分量,确定所述纹理分量。
进一步的,所述训练好的卷积神经网络编码器包括至少一个卷积块,每个所述卷积块包括:至少一个卷积层、至少一个池化层和第一激活层;利用训练好的卷积神经网络编码器对所述纹理分量进行编码压缩,得到第二压缩结果,包括:将所述纹理分量输入至所述训练好的卷积神经网络编码器,经所述卷积层、所述池化层和所述第一激活层学习特征,得到特征图像;将所述特征图像确定为所述第二压缩结果。
进一步的,在将所述第一压缩结果和第二压缩结果确定为人脸图像压缩结果之后,方法还包括:利用反量化熵解码器对所述第一压缩结果进行解码,得到重建的形状分量;利用训练好的反卷积神经网络解码器对所述第二压缩结果进行解码,得到重建的纹理分量;将所述重建的形状分量和所述重建的形状分量进行融合,得到与所述测试人脸对应的重建人脸图像。
进一步的,所述训练好的反卷积神经网络解码器包括至少一个反卷积块,每个所述反卷积块包括:至少一个反卷积层和第二激活层;利用训练好的反卷积神经网络解码器对所述第二压缩结果进行解码,得到重建的纹理分量,包括:将所述第二压缩结果输入至所述训练好的反卷积神经网络解码器,经所述反卷积层和所述第二激活层特征提取,得到反卷积图像;将所述反卷积图像确定为所述重建的纹理分量。
进一步的,在将所述重建的形状分量和所述重建的形状分量进行融合,得到与所述测试人脸对应的重建人脸图像之后,方法还包括:基于所述测试人脸图像,对所述重建人脸图像进行质量评价,得到质量评价结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010925736.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种自浮式焊机支撑平台
- 下一篇:一种双人运动转轮机构
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序