[发明专利]一种离散特征驱动的盲人脸图像丢失细节重建方法在审
申请号: | 202211215297.4 | 申请日: | 2022-09-30 |
公开(公告)号: | CN115565225A | 公开(公告)日: | 2023-01-03 |
发明(设计)人: | 楼旭东;徐振宇;刘怡光;王祎;房景鑫 | 申请(专利权)人: | 四川大学 |
主分类号: | G06V40/16 | 分类号: | G06V40/16;G06V10/42;G06V10/44;G06V10/46;G06V10/80;G06V10/82;G06N3/04;G06N3/08;G06T5/00;G06T5/50 |
代理公司: | 昆明合盛知识产权代理事务所(普通合伙) 53210 | 代理人: | 雷丹 |
地址: | 610044 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 离散 特征 驱动 盲人 图像 丢失 细节 重建 方法 | ||
1.一种离散特征驱动的盲人脸图像丢失细节重建方法,其特征在于,包括以下步骤:
S1:人脸数据集预处理;
S2:训练量化自编码器以获得上下文丰富的离散码本;
S3:进行局部特征提取,局部特征与位置编码共同输入Transformer编码器获取图像的全局特征,并对全局特征进行特征重表示,接着对重表示特征利用离散码本进行量化,在利用Transformer解码器进行特征补全,最后输入到解码器进行图像重建。
2.如权利要求1所述的一种离散特征驱动的盲人脸图像丢失细节重建方法,其特征在于,所述S2包括:
S201:将S1预处理得到的高清人脸图像Ihq输入到图像编码器以获取该图像对应的特征Zh;
S202:将特征Zh中的每个“像素”替换为可学习码本中距离最小的特征,得到量化后的特征Zc,将量化后的特征Zc输入到解码器重建得到输出Iout;
S203:对重建后的输出Iout和对应的原高清图像计算损失函数,反向传播更新模型参数;
按照设定的迭代次数和批大小重复上述S201-S203,期间每经过10000次迭代并在预处理的验证集验证并保存模型;
保存上述训练完成后得到离散码本。
3.如权利要求2所述的一种离散特征驱动的盲人脸图像丢失细节重建方法,其特征在于,所述S2先构建包括图像编码器和图像解码器的一阶段网络模型;
输入高清人脸图像Ihq输入到图像编码器,获取该图像对应的特征Zh,量化后的特征Zc,如下式:
其中,i,j分别为特征的行数和列数,用i,j表示二维空间的其中一个特征,ck为离散码本中的一个离散特征。
4.如权利要求2所述的一种离散特征驱动的盲人脸图像丢失细节重建方法,其特征在于,所述S2的损失函数包括重建损失、感知损失、对抗损失和码本损失;损失函数如下式:
Ltotal=Lpix+Lper+Ladv+Lcode
各个损失函数如下所示,其中,β=0.25:
Lpix=||Ihq-Iout||1
Lper=|φ(Ihq)-φ(Iout)||1
Ladv=logD(Ihq)+log(1-D(Iout))
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川大学,未经四川大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211215297.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于检测区块链交易异常的方法及相关产品
- 下一篇:一种抗菌黑纱制备工艺