[发明专利]局部生成人脸定位方法、装置、计算机设备和存储介质有效
申请号: | 202110709918.3 | 申请日: | 2021-06-25 |
公开(公告)号: | CN113609900B | 公开(公告)日: | 2023-09-12 |
发明(设计)人: | 陈北京;鞠兴旺;吴畏 | 申请(专利权)人: | 南京信息工程大学 |
主分类号: | G06V40/16 | 分类号: | G06V40/16;G06V10/774;G06V10/776;G06V10/82;G06N3/0455;G06N3/0464;G06N3/048;G06N3/08;G06V10/80 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 罗运红 |
地址: | 210032 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 局部 生成 定位 方法 装置 计算机 设备 存储 介质 | ||
1.一种局部生成人脸定位方法,其特征在于,所述方法包括:
获取待定位人脸图像;
将所述待定位人脸图像输入至训练好的局部生成人脸图像定位网络中,对所述待定位人脸图像的局部生成区域进行定位分析,输出所述待定位人脸图像的第一定位预测结果;
所述局部生成人脸图像定位网络的训练方式,包括:
获取局部生成人脸图像样本集,所述局部生成人脸图像样本集中的局部生成人脸图像样本包括:包含局部生成区域的人脸图像和对应的二值化的真实标签图像;
将所述局部生成人脸图像集划分为训练图像集和测试图像集;
初始化融合了RRU-Net和去噪操作模块的局部生成人脸定位网络,并按照正态分布随机初始化所述局部生成人脸定位网络中的参数;
利用所述训练图像集对所述局部生成人脸定位网络进行训练操作,获得初步训练好的局部生成人脸图像定位网络;
利用所述测试图像集对所述初步训练好的局部生成人脸图像定位网络中进行测试,当所述初步训练好的局部生成人脸图像定位网络满足预设要求时,获得训练好的局部生成人脸图像定位网络;
所述初始化融合了RRU-Net和去噪操作模块的局部生成人脸定位网络依次包括:第一卷积组、第二卷积组、第三卷积组、第四卷积组、第五卷积组、第一反卷积组、第二反卷积组、第三反卷积组和第四反卷积组;
所述第一卷积组、所述第二卷积组、所述第三卷积组和所述第四卷积组的输出,分别与所述第一反卷积组、所述第二反卷积组、所述第三反卷积组、所述第四反卷积组的输入融合,形成跳跃结构;
所述第三卷积组、所述第四卷积组、所述第五卷积组、所述第一反卷积组和所述第二反卷积组的组与组之间,设置了去噪操作模块;
所述局部生成人脸定位网络的执行过程包括:
输入待预测图像,使用所述第一卷积组中的环状残差块对输入的所述待预测图像进行卷积,得到第一特征图;
所述第一特征图经过池化窗口为2×2的最大池化层池化,得到第二特征图;
将所述第二特征图输入所述第二卷积组中的环状残差块进行卷积,得到第三特征图;
所述第三特征图经过池化窗口为2×2的最大池化层池化,得到第四特征图;
将所述第四特征图输入所述第三卷积组中的环状残差块进行卷积后,输出至对应的噪声操作模块对进行噪声操作,得到第五特征图;
所述第五特征图经过池化窗口为2×2的最大池化层池化,得到第六特征图;
将所述第六特征图输入所述第四卷积组中的环状残差块进行卷积后,输出至对应的噪声操作模块进行噪声操作,得到第七特征图;
所述第七特征图经过池化窗口为2×2的最大池化层池化,得到第八特征图;
将所述第八特征图输入所述第五卷积组中的环状残差块进行卷积后,输出至对应的噪声操作模块进行噪声操作,得到第八特征图;
对所述第八特征图进行反卷积后,并与所述第六特征图进行特征融合,获得第九特征图;
所述第九特征图通过所述第一反卷积组中的环状残差块进行卷积后,输出至对应的噪声操作模块进行噪声操作,得到第十特征图;
对所述第十特征图进行反卷积后,与所述第四特征图进行特征图融合,得到第十一特征图;
所述第十一特征图通过所述第二反卷积组中的环状残差块进行卷积后,输出至对应的噪声操作模块进行噪声操作得到第十二特征图;
对所述第十二特征图进行反卷积后,与所述第二特征图进行特征图融合,得到第十三特征图;
所述第十三特征图通过所述第三反卷积组中的环状残差块进行卷积,得到第十四特征图;
对所述第十四特征图进行反卷积后,与所述待预测图像进行特征图融合,得到第十五特征图;
所述第十五特征图通过所述第四反卷积组中的环状残差块进行卷积后,输出所述待预测图像的每个像素点的局部生成人脸定位预测结果;
所述环状残差块包括残差传播块和反馈块;
所述残差传播块表示为:
vf=f(z,{wi})+ws*zp
其中,zp为所建立残差传播块的输入,vf为所建立残差传播块的输出,f(z,{wi})为卷积操作,wi为所述残差传播块的第i层卷积的权重,表示学习的残差图,i∈1、2……n,n为所述残差传播块中卷积层的总层数,ws为一个线性变换,使前后两项维度相匹配;
在所述反馈块中,添加了注意力机制来学习不同特征通道之间的交互作用,所述反馈块表示为:
zb=(s(G(v))+1)*zq
其中,zq为所建立反馈块的输入,v为残差传播块的输出,zb为增强后的输入,G为一个线性映射,用于网络维度的统一,s为门控制激活函数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京信息工程大学,未经南京信息工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110709918.3/1.html,转载请声明来源钻瓜专利网。