[发明专利]关键点检测模型训练方法及装置在审
申请号: | 201811560699.1 | 申请日: | 2018-12-20 |
公开(公告)号: | CN111353325A | 公开(公告)日: | 2020-06-30 |
发明(设计)人: | 陈建业;张爱喜;史培元;刘巍;陈宇 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/40;G06K9/46;G06N3/08 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 荣甜甜;刘芳 |
地址: | 100086 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 关键 检测 模型 训练 方法 装置 | ||
本发明实施例提供一种关键点检测模型训练方法及装置,通过对第一训练数据集进行运动模糊处理得到第二训练数据集,将该第二训练数据集中的每幅图像输入至预先构建好的神经网络模型中,并利用关键点加权欧式距离的损失函数对神经网络进行迭代训练,直到得到收敛的神经网络模型,将该收敛的神经网络模型作为最终的关键点检查模型。该过程中,通过对第一训练数据集包含的主体明确、目标清晰的正常图像进行运动模糊处理,利用该些加入了随机的运动模糊处理的图像训练关键点检测模型,从而训练出能够对含有运动模糊的图像中的人体关键点进行准确检测的关键点检测模型。
技术领域
本发明实施例涉及视觉检测技术领域,尤其涉及一种关键点检测模型训练方法及装置。
背景技术
随着科技的发展以及大数据时代的到来,如何方便、精准的实现视频分析以及人机交互等成为热点问题。其中,人体关键点检测技术作为智能化的视觉检测技术,可以方便的赋予机器识别人体姿态的能力,具备快捷便利、节省人力、降低运行成本的优势,被广泛应用于人机交互、异常行为检测、自动驾驶等领域。
目前,常见的人体关键点识别技术中,将网络的上公开人体关键点数据集或自采集数据集作为训练数据集,对该训练数据集进行神经网络的训练,得到关键点检测模型;并用不同人体关键点的检测值和标注值的欧几里得距离作为损失函数,利用损失函数对关键点检测模型进行迭代,直到得到收敛的关键点检测模型。然后,将图片输入至该关键点检测模型,利用收敛的关键点检测模型对该图片进行分析,输出人体各个关键点在图片中的坐标值;或者,将视频帧输入至该关键点检测模型,利用收敛的关键点检测模型对该视频帧进行分析,输出人体各个关键点在视频帧中的坐标值。
上述训练关键点检测模型的过程中,网上公开的人体关键点数据集或自采集数据集包含主体明确、目标清晰的正常图像。当待检测图像,如图片或视频帧为清晰图像时,利用收敛的关键点检测模型进行关键点检测时,检测准确率较高。然而,在人机交互、视频分析等场景中,由于成像设备能力有限,且目标与成像设备之间存在相对运动,导致成像设备获得的图像存在运动模糊,利用上述的关键点检测模型对模糊图片或视频帧进行关键点检测时,很难准确识别到关键点。
发明内容
本发明实施例提供一种关键点检测模型训练方法及装置,通过对人体关键点加入随机的运动模糊处理,实现训练出能够检测出运动场景中人体关键点的关键点检测模型,提供人体关键点检测的准确率的目的。
第一方面,本发明实施例提供一种关键点检测模型训练方法,包括:
对第一训练数据集中的每幅图像进行运动模糊处理,得到第二训练数据集;
将所述第二训练数据集中的每幅图像输入神经网络模型,并利用损失函数对所述神经网络模型进行迭代,直到所述神经网络模型收敛,将收敛的神经网络模型作为关键点检测模型,所述神经网络模型为预先构建好的模型,所述关键点检测模型用于检测人物图像中人物的关键点。
一种可行的设计中,所述将所述第二训练数据集中的每幅图像输入神经网络模型,并利用损失函数对所述神经网络模型进行迭代,包括:
将所述第二训练数据集中的第一组图像输入至所述神经网络模型,所述第一组图像包含预设数量的图像;
确定所述第一组图像中每类关键点的权重,同一类关键点在所述第一组图像包含的各图像中的不同人物图像上的人体位置相同;
根据各类关键点的权重,更新损失函数;
利用更新后的损失函数更新所述神经网络模型;
将所述第二训练数据集中的第二组图像输入至更新后的神经网络模型,重复上述步骤直到得到收敛的神经网络模型。
一种可行的设计中,所述确定所述第一组图像中每类关键点的权重,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811560699.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种色盲矫正方法及装置
- 下一篇:一种电源箱