[发明专利]一种离散特征驱动的盲人脸图像丢失细节重建方法在审

专利信息
申请号: 202211215297.4 申请日: 2022-09-30
公开(公告)号: CN115565225A 公开(公告)日: 2023-01-03
发明(设计)人: 楼旭东;徐振宇;刘怡光;王祎;房景鑫 申请(专利权)人: 四川大学
主分类号: G06V40/16 分类号: G06V40/16;G06V10/42;G06V10/44;G06V10/46;G06V10/80;G06V10/82;G06N3/04;G06N3/08;G06T5/00;G06T5/50
代理公司: 昆明合盛知识产权代理事务所(普通合伙) 53210 代理人: 雷丹
地址: 610044 四*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 离散 特征 驱动 盲人 图像 丢失 细节 重建 方法
【权利要求书】:

1.一种离散特征驱动的盲人脸图像丢失细节重建方法,其特征在于,包括以下步骤:

S1:人脸数据集预处理;

S2:训练量化自编码器以获得上下文丰富的离散码本;

S3:进行局部特征提取,局部特征与位置编码共同输入Transformer编码器获取图像的全局特征,并对全局特征进行特征重表示,接着对重表示特征利用离散码本进行量化,在利用Transformer解码器进行特征补全,最后输入到解码器进行图像重建。

2.如权利要求1所述的一种离散特征驱动的盲人脸图像丢失细节重建方法,其特征在于,所述S2包括:

S201:将S1预处理得到的高清人脸图像Ihq输入到图像编码器以获取该图像对应的特征Zh

S202:将特征Zh中的每个“像素”替换为可学习码本中距离最小的特征,得到量化后的特征Zc,将量化后的特征Zc输入到解码器重建得到输出Iout

S203:对重建后的输出Iout和对应的原高清图像计算损失函数,反向传播更新模型参数;

按照设定的迭代次数和批大小重复上述S201-S203,期间每经过10000次迭代并在预处理的验证集验证并保存模型;

保存上述训练完成后得到离散码本。

3.如权利要求2所述的一种离散特征驱动的盲人脸图像丢失细节重建方法,其特征在于,所述S2先构建包括图像编码器和图像解码器的一阶段网络模型;

输入高清人脸图像Ihq输入到图像编码器,获取该图像对应的特征Zh,量化后的特征Zc,如下式:

其中,i,j分别为特征的行数和列数,用i,j表示二维空间的其中一个特征,ck为离散码本中的一个离散特征。

4.如权利要求2所述的一种离散特征驱动的盲人脸图像丢失细节重建方法,其特征在于,所述S2的损失函数包括重建损失、感知损失、对抗损失和码本损失;损失函数如下式:

Ltotal=Lpix+Lper+Ladv+Lcode

各个损失函数如下所示,其中,β=0.25:

Lpix=||Ihq-Iout||1

Lper=|φ(Ihq)-φ(Iout)||1

Ladv=logD(Ihq)+log(1-D(Iout))

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川大学,未经四川大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202211215297.4/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top