[发明专利]手部关键点的识别模型训练方法、识别方法及设备有效
申请号: | 201810752953.1 | 申请日: | 2018-07-10 |
公开(公告)号: | CN110163048B | 公开(公告)日: | 2023-06-02 |
发明(设计)人: | 易阳;赵世杰;李峰;左小祥 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06V40/20 | 分类号: | G06V40/20;G06F3/01;G06V10/82;G06N3/0464;G06N3/0455;G06N3/048;G06N3/0475;G06N3/094;G06N3/084 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 张所明 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 关键 识别 模型 训练 方法 设备 | ||
1.一种手部关键点的识别模型训练方法,其特征在于,所述方法包括:
通过循环生成对抗网络Cycle-GAN模型,将样本虚拟图像转化为仿真图像,所述样本虚拟图像是三维建模生成的图像,且所述样本虚拟图像包含手部关键点对应的关键点坐标,所述仿真图像用于模仿真实场景下采集的图像;
提取所述仿真图像中的手部图像;
构建手部关键点识别模型,所述手部关键点识别模型用于根据输入的真实图像输出所述真实图像中手部的手部关键点坐标,所述手部关键点识别模型包括二维识别分支和三维识别分支,所述二维识别分支包括i层二维残差层和卷积层,所述三维识别分支包括i层三维残差层和全连接层,且前j层二维残差层与前j层三维残差层耦合,2≤j≤i-1,i和j为整数;
将所述手部图像分别输入所述二维识别分支和所述三维识别分支;
对第k层二维残差层输出的特征图和第k层三维残差层输出的特征图进行相加操作,1≤k≤j-1;
将相加后的特征图输入第k+1层二维残差层和第k+1层三维残差层;
通过第j+1至第i层二维残差层以及所述卷积层对所述第j层二维残差层输出的特征图进行处理,得到二维识别结果;
通过第j+1至第i层三维残差层以及所述全连接层对所述第j层三维残差层输出的特征图进行处理,得到三维识别结果;
根据所述二维识别结果和所述关键点坐标计算二维识别损失;
根据所述三维识别结果和所述关键点坐标计算三维识别损失;
根据所述二维识别损失和所述三维识别损失反向训练所述手部关键点识别模型。
2.根据权利要求1所述的方法,其特征在于,所述通过Cycle-GAN模型,将样本虚拟图像转化为仿真图像之前,所述方法还包括:
根据样本真实图像和所述样本虚拟图像训练所述Cycle-GAN模型,所述样本真实图像是真实场景下采集的图像。
3.根据权利要求2所述的方法,其特征在于,所述根据样本真实图像和所述样本虚拟图像训练所述Cycle-GAN模型,包括:
构建第一生成器和第二生成器,所述第一生成器用于生成所述仿真图像,所述第二生成器用于生成仿虚拟图像,所述仿虚拟图像用于模仿所述样本虚拟图像的风格;
构建第一判别器和第二判别器,所述第一判别器用于判别所述样本虚拟图像和所述仿虚拟图像,所述第二判别器用于判别所述样本真实图像和所述仿真图像;
根据所述第一生成器、所述第二生成器、所述第一判别器和所述第二判别器构建所述Cycle-GAN模型;
根据所述样本真实图像和所述样本虚拟图像计算所述Cycle-GAN模型的损失,所述Cycle-GAN模型的损失包括生成器损失、判别器损失和循环损失;
根据所述Cycle-GAN模型的损失反向训练所述Cycle-GAN模型。
4.根据权利要求3所述的方法,其特征在于,所述通过Cycle-GAN模型,将样本虚拟图像转化为仿真图像,包括:
通过所述Cycle-GAN模型中的所述第一生成器,将所述样本虚拟图像转化为所述仿真图像。
5.根据权利要求1至4任一所述的方法,其特征在于,所述提取所述仿真图像中的手部图像,包括:
将所述仿真图像输入手势分割神经网络,输出手部置信区域,所述手势分割神经网络根据标注有手部区域的图像训练得到;
根据所述手部置信区域,从所述仿真图像中提取手部图像。
6.根据权利要求5所述的方法,其特征在于,所述手势分割神经网络包括n层卷积层和n层反卷积层,n≥2,n为整数;
所述将所述仿真图像输入手势分割神经网络,输出手部置信区域,包括:
通过所述n层卷积层对所述仿真图像进行处理,得到所述仿真图像对应的中间特征图;
通过所述n层反卷积层对所述中间特征图进行处理,得到所述仿真图像对应的目标特征图;
根据所述目标特征图生成概率矩阵,所述概率矩阵用于表征所述仿真图像中各个像素点是手部的概率;
对所述概率矩阵进行二值化处理,输出所述手部区域对应的热图,所述热图用于指示所述仿真图像中的所述手部置信区域。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810752953.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种检测车道线的方法及装置
- 下一篇:一种人脸属性预测方法、装置及存储介质