[发明专利]基于深度学习的人脸图像压缩方法及装置有效

专利信息
申请号: 202010925736.5 申请日: 2020-09-04
公开(公告)号: CN112053408B 公开(公告)日: 2021-05-25
发明(设计)人: 段一平;陶晓明;胡舒展;刘永嘉;张栩铭;陆建华 申请(专利权)人: 清华大学
主分类号: G06T9/00 分类号: G06T9/00;G06T7/529;G06K9/62;G06N3/04;G06N3/08
代理公司: 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 代理人: 安卫静
地址: 10008*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 深度 学习 图像 压缩 方法 装置
【说明书】:

发明提供了一种基于深度学习的人脸图像压缩方法及装置,涉及图像处理的技术领域,包括:先基于平均人脸图像和主动外观模型,将测试人脸图像分解为形状分量和纹理分量;然后利用量化熵编码器对形状分量进行编码压缩,得到第一压缩结果;再利用训练好的卷积神经网络编码器对纹理分量进行编码压缩,得到第二压缩结果;最后将第一压缩结果和第二压缩结果确定为人脸图像压缩结果。本发明将平均人脸图像和主动外观模型作为先验知识,且采用训练好的卷积神经网络编码器对纹理分量进行编码压缩的方式可以得到低维度特征表示的第二压缩结果,降低了纹理分量的冗余度,提高了人脸图像的压缩效率。

技术领域

本发明涉及图像处理技术领域,尤其是涉及一种基于深度学习的人脸图像压缩方法及装置。

背景技术

随着互联网技术的发展,以视频为主体的移动多媒体数据急剧增长,超过5G带宽增速,导致超高清视频业务面临研究挑战。在目前或者可见的将来,信息产生的体量和对应的传输技术在增长速度上会产生一定程度的脱节。数据规模的不断扩张,使其与无线带宽资源之间的矛盾日益突出。在全球新冠疫情期间,远程诊疗、远程探视、远程会议、远程办公等已经悄然成为常态,而人脸图像是相关业务的主要载体,目前大多采用JPEG 2000视频编码标准进行人脸图像压缩,由于采用JPEG 2000标准处理算法比较复杂,因此其处理每一帧人脸图像的时间较长,因而大幅提升人脸图像压缩效率仍然是难题。

发明内容

本发明的目的在于提供一种基于深度学习的人脸图像压缩方法及装置,以缓解现有技术中存在的压缩复杂度高、人脸图像压缩效率较低的技术问题。

第一方面,本发明提供的一种基于深度学习的人脸图像压缩方法,其中,包括:基于平均人脸图像和主动外观模型,将测试人脸图像分解为形状分量和纹理分量;利用量化熵编码器对所述形状分量进行编码压缩,得到第一压缩结果;利用训练好的卷积神经网络编码器对所述纹理分量进行编码压缩,得到第二压缩结果;将所述第一压缩结果和第二压缩结果确定为人脸图像压缩结果。

进一步的,基于平均人脸图像和主动外观模型,将测试人脸图像分解为形状分量和纹理分量,包括:获取平均人脸图像的预设标志点坐标;将所述测试人脸图像输入至所述主动外观模型,得到测试人脸图像的面部标志点坐标;基于所述测试人脸图像的面部标志点坐标和所述平均人脸图像的预设标志点坐标,确定测试人脸图像的预设标志点坐标;基于测试人脸图像的预设标志点坐标,确定所述形状分量;基于所述形状分量与纹理分量之间的预设关系和所述形状分量,确定所述纹理分量。

进一步的,所述训练好的卷积神经网络编码器包括至少一个卷积块,每个所述卷积块包括:至少一个卷积层、至少一个池化层和第一激活层;利用训练好的卷积神经网络编码器对所述纹理分量进行编码压缩,得到第二压缩结果,包括:将所述纹理分量输入至所述训练好的卷积神经网络编码器,经所述卷积层、所述池化层和所述第一激活层学习特征,得到特征图像;将所述特征图像确定为所述第二压缩结果。

进一步的,在将所述第一压缩结果和第二压缩结果确定为人脸图像压缩结果之后,方法还包括:利用反量化熵解码器对所述第一压缩结果进行解码,得到重建的形状分量;利用训练好的反卷积神经网络解码器对所述第二压缩结果进行解码,得到重建的纹理分量;将所述重建的形状分量和所述重建的形状分量进行融合,得到与所述测试人脸对应的重建人脸图像。

进一步的,所述训练好的反卷积神经网络解码器包括至少一个反卷积块,每个所述反卷积块包括:至少一个反卷积层和第二激活层;利用训练好的反卷积神经网络解码器对所述第二压缩结果进行解码,得到重建的纹理分量,包括:将所述第二压缩结果输入至所述训练好的反卷积神经网络解码器,经所述反卷积层和所述第二激活层特征提取,得到反卷积图像;将所述反卷积图像确定为所述重建的纹理分量。

进一步的,在将所述重建的形状分量和所述重建的形状分量进行融合,得到与所述测试人脸对应的重建人脸图像之后,方法还包括:基于所述测试人脸图像,对所述重建人脸图像进行质量评价,得到质量评价结果。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010925736.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top