[发明专利]一种关于图像关键点检测的神经网络模型建立方法在审
申请号: | 201911225292.8 | 申请日: | 2019-12-04 |
公开(公告)号: | CN111127495A | 公开(公告)日: | 2020-05-08 |
发明(设计)人: | 朱帅印;丁雪峰 | 申请(专利权)人: | 深圳市图郅创新科技有限公司 |
主分类号: | G06T7/13 | 分类号: | G06T7/13;G06N3/04 |
代理公司: | 北京联瑞联丰知识产权代理事务所(普通合伙) 11411 | 代理人: | 赵娜 |
地址: | 518052 广东省深圳市南山区粤海*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 关于 图像 关键 检测 神经网络 模型 建立 方法 | ||
1.一种关于图像关键点检测的神经网络模型建立方法,其特征在于,包括如下步骤:
获取图像关键点数据集步骤,所述数据集由多个图像及图像关键点的原始位置坐标组成;
预处理所述数据集步骤,将数据集中的图像统一缩放至指定尺寸,并将轮廓关键点的原始位置坐标映射至缩放后的图像上,然后将所述图像上各像素值进行归一化;
数据集分类步骤,将预处理后的所述数据集分为测试集、验证集及测试集;
数据训练步骤,将测试集中的数据输入神经网络模型中进行训练,输出训练后的轮廓关键点预测位置坐标,并将其与原始位置坐标进行计算,得到多个误差值;
修正模型参数步骤,用所述数据训练步骤得到的每个误差值反向输入所述神经网络模型,以修正所述神经网络模型的参数,以得到误差较小的神经网络模型进行图像关键点检测。
2.如权利要求1所述的神经网络模型建立方法,其特征在于,在所述修正模型参数步骤之后,还包括验证神经网络模型的步骤,其方法为,将所述验证集的数据在多个修正后的神经网络模型上执行一次数据训练步骤,计算验证集上每个数据的平均误差值,保存平均误差值最小的验证神经网络模型。
3.如权利要求2所述的神经网络模型建立方法,其特征在于,在验证神经网络模型的步骤之后,还包括测试神经网络模型的步骤,具体方法为:将所述测试集数据输入所述验证神经网络模型,计算测试集上每个数据的测试平均误差值,经过多次数据训练、验证及测试后,所述测试集上平均误差最小的神经网络模型为最终神经网络模型,使用该最终神经网络模型进行图像关键点的检测。
4.如权利要求1所述的神经网络模型建立方法,其特征在于,数据训练步骤为:将归一化的图像数据输入特征提取模块,特征提取模块输出图像低级特征的响应值,所述响应值经过一个Hourglass模块及一个Bottle模块的计算后,输出到FC全连接层,FC的全连接层输出到Score层,该结构可以不断重复,最后一个阶段的输出值为Score层的激活值,Score层每个通道对应于一个关键点的热图预测,热图数值最大的坐标即为网络对于该特征点的预测。
5.如权利要求4所述的神经网络模型建立方法,其特征在于,所述特征提取模块为VGG16、VGG19或者ResNet模型。
6.如权利要求4所述的神经网络模型建立方法,其特征在于,所述图像数值在Hourglass模块中运算逻辑为:输入值经过至少一个Maxpool和至少一个Bottle模块,尺寸不断缩小至原始图像大小的预定比例,中间经过两个个Bottle模块,再经过Upsample层进行上采样,将图像大小恢复至进行上一次最大池化之前的尺寸,再和上一次最大池化之前的原始图像逐像素相加,不断重复此过程,直到恢复至输入Hourglass模块的原始尺寸。
7.如权利要求4所述的神经网络模型建立方法,其特征在于,所述图像数值在Bottle模块中运算逻辑为:输入值经过一个Batch Normalization层进行批标准化,然后经过Relu卷积层,再经过卷积层将图像大小缩小预定比例,中间经过一个Batch Normalization层进行批标准化,然后经过Relu层,再经过卷积层后图像大小不变,然后再经过BatchNormalization层进行批标准化,然后经过Relu层,再经过卷积层和Upsample上采样层恢复至输入图像大小,再和输入图像对应通道逐像素相加。
8.如权利要求7或8所述的神经网络模型建立方法,其特征在于,将图像大小缩小的比例为2n,n为自然数。
9.如权利要求1所述的神经网络模型建立方法,其特征在于,所述测试集、验证集及测试集的数据量比为4~8:1~3:1~3。
10.如权利要求1所述的神经网络模型建立方法,其特征在于,将各像素值进行归一化的方法为:计算图像数据集中所有图像RGB各个通道的均值M和方差N,图像像素值为I,归一化后的像素值为(I-M)/N。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市图郅创新科技有限公司,未经深圳市图郅创新科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911225292.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:钢网清洗管理方法及系统
- 下一篇:一种在线式自动折弯机
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序