[发明专利]位姿检测方法及装置、电子设备和存储介质有效
申请号: | 201810950565.4 | 申请日: | 2018-08-20 |
公开(公告)号: | CN109284681B | 公开(公告)日: | 2020-11-27 |
发明(设计)人: | 汪旻;刘文韬;钱晨 | 申请(专利权)人: | 北京市商汤科技开发有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00 |
代理公司: | 北京林达刘知识产权代理事务所(普通合伙) 11277 | 代理人: | 刘新宇 |
地址: | 100084 北京市海淀区中*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 检测 方法 装置 电子设备 存储 介质 | ||
本公开涉及一种位姿检测方法及装置、电子设备和存储介质,其中所述方法包括:确定目标图像中目标对象的各第一特征部的第一位置信息,其中所述目标图像由摄像设备摄取;基于第一位置信息和所述摄像设备的设备参数确定针对所述目标对象的第二特征部的三维位置信息,所述第二特征部至少包括各第一特征部;基于对应的所述第一位置信息和三维位置信息确定所述目标对象的空间位姿。本公开实施例可提高位姿检测精度。
技术领域
本公开涉及图像处理技术领域,尤其涉及一种位姿检测方法及装置、电子设备和存储介质。
背景技术
在计算机视觉中,人体姿态估计是重要的人机交互接口,尤其是对人体在三维空间中的姿态和位置估计,是交互过程中最基础,也是最关键的内容。
传统技术中,利用了较为昂贵的深度摄像头设备,对人体进行相对粗糙的三维建模,从而达到预测人体相对相机位姿的目的。但是如今大多数的摄像设备只有RGB三通道的数据,所以传统方法无法得到大规模的推广。
利用RGB摄像头设备,现有的技术局限于二维人体关键点检测和三维人体姿态的粗略估计,无法定位人体在整个三维空间中的大小和位置,这意味着无法预测人是否进行了移动。
近年来,深度学习算法的进步,使得通过图片直接预测三维人体姿态成为了大多数应用首选的办法,但是直接使用深度神经网络进行位姿的预测,也无法得到令人满意的精度。
发明内容
本公开实施例提供了一种结合摄像设备的设备参数执行人体位姿检测从而提高检测精度的位姿检测方法及装置、电子设备和存储介质。
根据本公开的一方面,提供了一种位姿检测方法,其包括:
确定目标图像中目标对象的各第一特征部的第一位置信息,其中所述目标图像由摄像设备摄取;
基于第一位置信息和所述摄像设备的设备参数确定针对所述目标对象的第二特征部的三维位置信息,所述第二特征部至少包括各第一特征部;
基于对应的所述第一位置信息和三维位置信息确定所述目标对象的空间位姿。
在本公开实施例中,所述确定目标图像中目标对象的各第一特征部的第一位置信息包括:
获取所要识别的第一特征部的信息;
基于获取的第一特征部的信息,识别所述目标对象中的各所述第一特征部;
基于建立的二维坐标系确定各所述第一特征部的第一位置信息。
在本公开实施例中,所述基于第一位置信息和所述摄像设备的设备参数确定针对所述目标对象的第二特征部的三维位置信息包括:
基于所述摄像设备的设备参数对各所述第一位置信息执行归一化处理,得到第二位置信息;
利用各所述第二位置信息确定所述第二特征部的三维位置信息。
在本公开实施例中,所述基于所述摄像设备的设备参数对各所述第一位置信息执行归一化处理,得到第二位置信息包括:
利用所述设备参数对所述第一位置信息执行第一归一化处理,得到各所述第一特征部的第三位置信息;
确定各第一特征部的第三位置信息的均值和方差;
基于所述均值和方差对各所述第三位置信息执行第二归一化处理,得到所述第二位置信息。
在本公开实施例中,所述利用所述设备参数对所述第一位置信息执行第一归一化处理,得到各所述第一特征部的第三位置信息包括:
利用所述设备参数对所述第一位置信息执行去畸变处理;
对去畸变处理后的第一位置信息执行第一归一化处理,得到各所述第一特征部的第三位置信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京市商汤科技开发有限公司,未经北京市商汤科技开发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810950565.4/2.html,转载请声明来源钻瓜专利网。