[发明专利]一种多人图像上的人体骨骼关键点的位置排布检测方法有效
申请号: | 201811051570.8 | 申请日: | 2018-10-19 |
公开(公告)号: | CN109255783B | 公开(公告)日: | 2020-09-25 |
发明(设计)人: | 梁峰;浦汉来 | 申请(专利权)人: | 上海摩象网络科技有限公司 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06T7/73 |
代理公司: | 北京知呱呱知识产权代理有限公司 11577 | 代理人: | 冯建基;孙进华 |
地址: | 200030 上海市徐汇区漕河泾开*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图像 人体 骨骼 关键 位置 排布 检测 方法 | ||
本发明公开了一种多人图像上的人体骨骼关键点的位置排布检测方法,通过构建并训练全卷积深度神经网络,将人体骨骼关键点原始彩色图像经初步处理后转化为深度图再作为该全卷积深度神经网络的输入,经若干阶段的循环变换计算输出18骨骼关键点位置的18层人体骨骼单关键点置信图以及17个人体骨骼关键点链接段的17层人体骨骼单段关键点链接场图,在多阶段循环变换计算中,利用循环结束验证判断公式验证循环结束的节点,另外,还通过计算多阶段循环变换计算总损失L对多阶段循环变换计算进行训练控制,本发明有效地利用特征信息、结合全局与局部信息,从而输出更加丰富的特征信息,提高骨骼关键点的定位效果。
技术领域
本发明涉及计算机视觉研究技术领域,具体涉及一种多人图像上的人体骨骼关键点的位置排布检测方法。
背景技术
计算机视觉研究领域中其中一个重要的任务是人体骨骼关键点检测,具体来说是使得计算机能够感知人体各个骨骼关键点的位置,为进一步的动作识别、动作异常检测等多个实用场景提供基础。
人体骨骼关键点检测任务的目标是以一张图片作为输入,输出图中人体的各个骨骼关键点在图片中的横纵坐标。输入图片往往有两种,一种是三维的RGB彩色图片,另外一种是二维的深度图。RGB图片往往由于光线明暗、衣着复杂、背景杂乱等干扰因素而增加人体骨骼关键点检测的难度。而深度摄像机能够测量人与相机之间的距离,把距离转化成深度值(每个像素的深度值是该点所处的真实空间到深度摄像机之间的距离,并通过一定计算转化而成的值),直接勾勒出人体的轮廓,具有抗光线明暗、衣着复杂、背景杂乱等干扰性,大大增强了神经网络输出的鲁棒性以及能够用简化神经网络的构建复杂度,也就能够减少计算复杂度从而加快神经网络的运行速度。因此使用深度图是一种人体骨骼关键点检测的重要数据类型。
然而,由于深度图缺乏对于人体细节的记录,深度图会存在一些深度噪声,并且人体自遮挡以及外部障碍物遮挡等困难依旧存在,因此要求稳定快速地进行基于深度图进行二维人体骨骼关键点检测依旧是一个十分具有挑战性的课题。此外,人体骨骼关键点检测任务往往需求模型既能够推断出不同骨骼关键点之间的相互联系(全局信息),又能够根据图片特征块区区域的细节特征(局部信息)来判断该区域所对应的骨骼点,因此设计出有效的模型来结合两者信息也是更好地去解决以上问题的方法。
发明内容
本发明的目的在于提供一种多人图像上的人体骨骼关键点的位置排布检测方法,用以解决目前人体骨骼关键点检测中存在的利用RGB图片检测造成的干扰性大、利用深度图检测存在深度噪音以及计算模型不能很好地结合全局信息和局部信息的技术问题。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海摩象网络科技有限公司,未经上海摩象网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811051570.8/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序