[发明专利]一种基于CCA空间的人脸图像多层重构方法有效
申请号: | 201811322383.9 | 申请日: | 2018-11-08 |
公开(公告)号: | CN109712069B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 郭立君;李小宝;张荣;姚正元 | 申请(专利权)人: | 宁波大学 |
主分类号: | G06T3/40 | 分类号: | G06T3/40;G06T5/50 |
代理公司: | 宁波奥圣专利代理有限公司 33226 | 代理人: | 周珏 |
地址: | 315211 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于CCA空间的人脸图像多层重构方法,其采用大尺寸对训练的低、高分辨率人脸图像及测试的低分辨率人脸图像分块,获得低分辨率字典和高分辨率字典;然后对两类字典进行一次CCA映射,并对两类一次映射的字典进行稀疏更新;接着对两类更新后的字典进行反映射,并对两类反映射字典进行再次CCA映射;之后通过计算两类再次映射的字典各自中的每列向量分别与测试的低分辨率图像中对应图像块的列向量的欧氏距离对字典排序,并通过基于平滑的超分辨率重构方法获得经一层重构的高分辨率人脸图像;再选择小尺寸进行分块,重复上述过程,并引入一层重构的高分辨率图像的约束,获得经二层重构的高分辨率人脸图像;优点是重构效果好。 | ||
搜索关键词: | 一种 基于 cca 空间 图像 多层 方法 | ||
【主权项】:
1.一种基于CCA空间的人脸图像多层重构方法,其特征在于包括以下步骤:步骤一:选取一个人脸图像数据库,该人脸图像数据库中包含至少两幅低分辨率人脸图像及每幅低分辨率人脸图像对应的高分辨率人脸图像,将人脸图像数据库中的第n幅低分辨率人脸图像及其对应的高分辨率人脸图像对应记为
和
并将测试的低分辨率人脸图像记为
其中,n为正整数,1≤n≤N,N表示人脸图像数据库中包含的低分辨率人脸图像的总幅数,N≥2,
和
的宽度均为W,
和
的高度均为H;步骤二:采用滑动窗口技术将人脸图像数据库中的每幅低分辨率人脸图像划分成S1个相互重叠的尺寸大小为k1×k1的图像块,将
中的第s1个图像块记为
同样,采用滑动窗口技术将人脸图像数据库中的每幅低分辨率人脸图像对应的高分辨率人脸图像划分成S1个相互重叠的尺寸大小为k1×k1的图像块,将
中的第s1个图像块记为
采用滑动窗口技术将
划分成S1个相互重叠的尺寸大小为k1×k1的图像块,将
中的第s1个图像块记为
其中,滑动窗口的大小为k1×k1,k1=5,7,9,11,滑动窗口的滑动步长为1个像素点,S1=(W‑k1+1)×(H‑k1+1),s1为正整数,1≤s1≤S1;步骤三:将人脸图像数据库中的每幅低分辨率人脸图像中的每个图像块中的所有像素点的像素值排列构成对应的列向量,将
对应的列向量记为
同样,将人脸图像数据库中的每幅低分辨率人脸图像对应的高分辨率人脸图像中的每个图像块中的所有像素点的像素值排列构成对应的列向量,将
对应的列向量记为
将
中的每个图像块中的所有像素点的像素值排列构成对应的列向量,将
对应的列向量记为
然后将人脸图像数据库中的所有低分辨率人脸图像中的同一位置的图像块对应的列向量构成一个低分辨率字典,共构成S1个低分辨率字典,将人脸图像数据库中的所有低分辨率人脸图像中的第s1个图像块对应的列向量构成的低分辨率字典记为
同样,将人脸图像数据库中的所有高分辨率人脸图像中的同一位置的图像块对应的列向量构成一个高分辨率字典,共构成S1个高分辨率字典,将人脸图像数据库中的所有高分辨率人脸图像中的第s1个图像块对应的列向量构成的高分辨率字典记为
其中,![]()
的维数均为(k1×k1)×1,
的维数均为(k1×k1)×N,
中的第n个列向量为
中的第n个列向量为
步骤四:计算每个低分辨率字典和每个高分辨率字典各自对应的投影矩阵,将
对应的投影矩阵记为
将
对应的投影矩阵记为
其中,
和
的维数均为L×(k1×k1),L表示CCA空间的维度大小,L∈{1,2,…,k1×k1};步骤五:将每个低分辨率字典从图像空间映射到CCA空间,得到对应的一次映射低分辨率字典,将
对应的一次映射低分辨率字典记为![]()
同样,将每个高分辨率字典从图像空间映射到CCA空间,得到对应的一次映射高分辨率字典,将
对应的一次映射高分辨率字典记为![]()
其中,
和
的维数均为L×N;步骤六:计算每个一次映射低分辨率字典的稀疏系数向量,将
的稀疏系数向量记为
通过计算
得到;然后利用每个一次映射低分辨率字典的稀疏系数向量对该一次映射低分辨率字典进行一次稀疏更新,得到每个一次映射低分辨率字典更新后的字典,将
更新后的字典记为
若
中的第n个元素为非零元素,则将
中的第n列向量提取出来,再将从
中提取出的所有列向量按原顺序构成
同样,对每个一次映射高分辨率字典进行一次稀疏更新,得到每个一次映射高分辨率字典更新后的字典,将
更新后的字典记为
若
中的第n个元素为非零元素,则将
中的第n列向量提取出来,再将从
中提取出的所有列向量按原顺序构成
其中,
的维数为N×1,argmin()表示求残差最小值,符号“|| ||2”为l2范数正则项运算符号,符号“|| ||1”为l1范数正则项运算符号,λ1为一个常数,λ1∈(0,1),
和
的维数为L×M,M表示
中的非零元素的总个数,1≤M<N;步骤七:将每个一次映射低分辨率字典更新后的字典从CCA空间反映射回图像空间,得到对应的反映射低分辨率字典,将
对应的反映射低分辨率字典记为
同样,将每个一次映射高分辨率字典更新后的字典从CCA空间反映射回图像空间,得到对应的反映射高分辨率字典,将
对应的反映射高分辨率字典记为
其中,
和
的维数为(k1×k1)×M;步骤八:计算每个反映射低分辨率字典和每个反映射高分辨率字典各自对应的投影矩阵,将
对应的投影矩阵记为
将
对应的投影矩阵记为
其中,
和
的维数均为L×(k1×k1),L表示CCA空间的维度大小,L∈{1,2,…,k1×k1};步骤九:将每个反映射低分辨率字典从图像空间映射到CCA空间,得到对应的再次映射低分辨率字典,将
对应的再次映射低分辨率字典记为![]()
同样,将每个反映射高分辨率字典从图像空间映射到CCA空间,得到对应的再次映射高分辨率字典,将
对应的再次映射高分辨率字典记为![]()
将
中的每个图像块从图像空间映射到CCA空间,得到
中的每个图像块对应的一次映射块,将
对应的一次映射块记为
将
中的每个图像块对应的一次映射块中的所有像素点的像素值排列构成对应的列向量,将
对应的列向量记为![]()
其中,
和
的维数均为L×M,
的维数为L×1;步骤十:计算每个再次映射低分辨率字典中的每列向量与
中的每个图像块对应的一次映射块对应的列向量的欧氏距离,针对
计算
中的每列向量与
的欧氏距离,针对
共得到M个欧氏距离;然后针对每个再次映射低分辨率字典得到的M个欧氏距离,对M个欧氏距离按从大到小的顺序进行排序;再根据针对每个再次映射低分辨率字典得到的M个欧氏距离的大小顺序,对每个再次映射低分辨率字典中的所有列向量进行位置调整,重组得到对应的重组低分辨率字典,将
对应的重组低分辨率字典记为
中的第1个列向量与
的欧氏距离最大,
中的最后一个列向量与
的欧氏距离最小;其中,
的维数为L×M;同样,计算每个再次映射高分辨率字典中的每列向量与
中的每个图像块对应的一次映射块对应的列向量的欧氏距离,针对
计算
中的每列向量与
的欧氏距离,针对
共得到M个欧氏距离;然后针对每个再次映射高分辨率字典得到的M个欧氏距离,对M个欧氏距离按从大到小的顺序进行排序;再根据针对每个再次映射高分辨率字典得到的M个欧氏距离的大小顺序,对每个再次映射高分辨率字典中的所有列向量进行位置调整,重组得到对应的重组高分辨率字典,将
对应的重组高分辨率字典记为
中的第1个列向量与
的欧氏距离最大,
中的最后一个列向量与
的欧氏距离最小;其中,
的维数为L×M;步骤十一:计算
中的每个图像块的第一稀疏系数向量,将
的第一稀疏系数向量记为
通过
计算得到;然后将
经一层重构后得到的高分辨率人脸图像记为
将
中与
位置对应的区域记为
将
中的所有像素点的像素值排列构成的列向量记为![]()
其中,
的维数为M×1,m为正整数,1≤m≤M,λ2和λ3均为常数,λ2∈(0,1),λ3∈(0,1),
表示
中的第m个元素,
表示
中的第m列向量,
表示
中的第m‑1个元素;步骤十二:改变滑动窗口的大小,使其大小为k2×k2;然后按照步骤二至步骤十的过程,以相同的方式获得S2个重组低分辨率字典和S2个重组高分辨率字典,将第s2个重组低分辨率字典记为
将第s2个重组高分辨率字典记为
接着计算
中的每个图像块的第二稀疏系数向量,将
中的第s2个图像块
的第二稀疏系数向量记为
通过
计算得到;再将
经二层重构后得到的高分辨率人脸图像记为
将
中与
位置对应的区域记为
将
中的所有像素点的像素值排列构成的列向量记为![]()
其中,
和
的维数为L×M,k2=3,5,7,9且1<k2<k1,S2表示采用滑动窗口技术将人脸图像数据库中的每幅低分辨率人脸图像及其对应的高分辨率人脸图像、
划分成的相互重叠的尺寸大小为k2×k2的图像块的总个数,S2=(W‑k2+1)×(H‑k2+1),1≤s2≤S2,
的维数为M×1,
为按照获取
的过程以相同的方式获得的投影矩阵,
表示
中的所有像素点的像素值排列构成对应的列向量,
表示
中的第m个元素,
表示
中的第m‑1个元素,
表示
中的第m列向量,λ4为一个常数,λ4∈(0,1),
为按照获取
的过程以相同的方式获得的投影矩阵,
表示
中与
相对应的区域中的所有像素点的像素值排列构成对应的列向量,
表示
中的第m列向量。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宁波大学,未经宁波大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811322383.9/,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序