[发明专利]用于定位多目标特征点的深度学习模型的构建方法及装置有效
申请号: | 201910480628.9 | 申请日: | 2019-06-03 |
公开(公告)号: | CN110188780B | 公开(公告)日: | 2021-10-08 |
发明(设计)人: | 邹昆;王伟灿;董帅;侯卫东;李蓉 | 申请(专利权)人: | 电子科技大学中山学院 |
主分类号: | G06K9/46 | 分类号: | G06K9/46;G06K9/62 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 徐彦圣 |
地址: | 528400 *** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 定位 多目标 特征 深度 学习 模型 构建 方法 装置 | ||
1.一种用于定位多目标特征点的深度学习模型的构建方法,其特征在于,包括:
获取用于提取输入数据包括的特征数据的堆叠沙漏网络、用于根据所述特征数据进行目标检测得到目标位置信息的检测网络、用于根据所述特征数据进行关键点检测得到关键点信息的定位网络以及用于组合所述目标位置信息和所述关键点信息得到目标特征点并输出所述目标特征点的输出网络;
组合所述堆叠沙漏网络、所述检测网络、所述定位网络以及所述输出网络得到多任务学习网络模型;
获取关键点定位目标函数和边界检测目标函数;其中,关键点定位目标函数的计算公式为yi表示网络的预测值,表示对应的目标值,n表示样本数目;边界检测目标函数的计算公式为
λcoord为坐标损失调节系数;λnoobj为不含有物体格子的预测损失调节系数;S表示对图像的划分;B表示每个格子要预测边界框的数目;xi、yi表示第i个格子预测物体中心点的横、纵坐标;表示第i个格子中物体中心点真实的横、纵坐标;wi、hi表示预测的物体宽度、高度;表示物体真实的宽度、高度;Ci表示第i个格子预测包含物体的概率;表示第i个且包含物体的格子预测的第j个边界框的损失系数;的计算公式为c_col表示包含物体中心点的格子所在的列;c_row表示包含物体中心点的格子所在的行;σw表示高斯分布在图像宽度方向上的方差;σh表示高斯分布在图像高度方向上的方差;两个方向方差的通项公式为factor是用来控制决策权重随着与中心点格子距离增加的下降速度的调节因子,box_w表示包含物体的矩形框的宽度、box_h表示包含物体的矩形框的高度;
根据所述关键点定位目标函数和所述边界检测目标函数进行加权计算得到加权目标函数;
在所述多任务学习网络模型中设置加权目标函数、预设训练条件以及与所述输入数据对应的超参数,得到第一训练模型;
对所述第一训练模型进行训练,得到第二训练模型和与所述第二训练模型相对应的训练信息;
在所述训练信息满足所述预设训练条件时,保存所述第二训练模型为用于定位目标特征点的深度学习模型。
2.根据权利要求1所述的用于定位多目标特征点的深度学习模型的构建方法,其特征在于,所述检测网络为YOLO网络。
3.根据权利要求1所述的用于定位多目标特征点的深度学习模型的构建方法,其特征在于,所述获取用于提取输入数据包括的特征数据的堆叠沙漏网络、用于根据所述特征数据进行目标检测得到目标位置信息的检测网络、用于根据所述特征数据进行关键点检测得到关键点信息的定位网络以及用于组合所述目标位置信息和所述关键点信息得到目标特征点并输出所述目标特征点的输出网络的步骤之前,所述方法还包括:
通过预处理网络获取预设的训练集,并对所述训练集进行预处理得到输入数据。
4.根据权利要求1所述的用于定位多目标特征点的深度学习模型的构建方法,其特征在于,所述与所述输入数据对应的超参数至少包括与所述输入数据对应的数据要求、所述堆叠沙漏网络的堆叠次数、所述的堆叠沙漏网络的阶数、训练批尺寸、网络优化器、学习率初始值以及学习率调整要求。
5.根据权利要求1所述的用于定位多目标特征点的深度学习模型的构建方法,其特征在于,所述对所述第一训练模型进行训练,得到第二训练模型和与所述第二训练模型相对应的训练信息的步骤包括:
获取预设的训练集和预设的验证集;
通过所述训练集对所述第一训练模型进行训练,得到第二训练模型;
通过所述验证集对所述第二训练模型进行测试,并通过所述训练集对所述第二训练模型进行测试,得到与所述验证集对应的第一测试结果以及与所述训练集对应的第二测试结果;
根据所述第一测试结果和所述第二测试结果进行计算,得到与所述第二训练模型相对应的训练信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学中山学院,未经电子科技大学中山学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910480628.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种图像语义描述的生成方法
- 下一篇:一种基于深度学习的古诗文自动识别方法