[发明专利]一种基于三维地图辅助的单目视频行人三维定位方法有效
申请号: | 202110936647.5 | 申请日: | 2021-08-16 |
公开(公告)号: | CN113838140B | 公开(公告)日: | 2023-07-18 |
发明(设计)人: | 许志华;牛一如;孙文彬 | 申请(专利权)人: | 中国矿业大学(北京) |
主分类号: | G06T7/80 | 分类号: | G06T7/80;G06T7/13;G06V20/40;G06V10/82;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100083 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 三维 地图 辅助 目视 行人 定位 方法 | ||
1.一种基于三维地图辅助的单目视频行人三维定位方法,该方法包括:
步骤1:利用三维激光扫描仪获取不含待定位行人Pi的激光雷达点云C,然后利用场景部署的监控摄像头截取包含该目标Pi的单目视频图像F;
步骤2:分别用OF-XFYFZF和OC-XCYCZC表示单目视频图像F和激光雷达点云C的坐标系,采用直接线性变换算法实现相机标定,即从单目视频图像F和地面点云C中选取至少6对特征点,根据它们的2D-3D匹配关系按式(1)恢复相机的内方位元素矩阵A(u0,v0,f)
式(1)中(u0,v0)表示像主点坐标,f为焦距,E表示视频图像F获取瞬间的外方位元素矩阵,包含平移向量T和旋转矩阵R,(Xw,Yw,Zw)为待定位目标Pi的物方三维坐标,(u,v)是其像方二维坐标;
步骤3:利用YOLO目标检测器获取单目视频图像F中的行人Pi的二维检测框,即将整个图像作为网络的输入,同时预测目标区域及其类别,将行人检测框上边缘的中点t,即行人头部的位置和下边缘的中点b,即行人脚部的位置,作为标记点,分别用(ut,vt),(ub,vb)表示其像素坐标;
步骤4:因激光扫描仪中的陀螺仪可保证点云坐标系中的Z轴始终垂直于地面,从激光雷达点云C中提取地平面,获取其竖直方向坐标值Zg;
步骤5:对于仅出现在单目视频图像F中的待定位目标行人Pi,完成步骤2相机标定和姿态恢复后,将步骤4中提取的地平面竖直方向坐标值Zg引入共线方程求取行人脚点b的三维坐标(Xb,Yb,Zb):
其中ai,bi,ci(i=1,2,3)表示旋转矩阵R中的元素值,(XS,YS,ZS)表示平移向量T中的元素值;
步骤6:考虑到单目视觉定位的不适定性,求解过程中引入行人始终垂直于地面作为约束条件,计算待定位目标行人Pi的头部点t的重投影误差(Δut,Δvt):
上式中表示直接从视频图像F中检测得到的点t的像素坐标,则有:
相应地,公式(4)中的重投影误差可以表示为关于行人头部点t竖直方向坐标值Zt的方程:
对式(7)进行矩阵运算计算未知数Zt的改正数ΔZt,经过多次迭代,得到满足精度要求的点t三维坐标,获取行人Pi头和脚的三维坐标后,计算行人身高h:
步骤7:步骤6得到的(Xt,Yt,Zt)和(Xb,Yb,Zb)即为满足所设置的阈值条件下的待定位目标行人Pi的头和脚三维坐标,基于此即可确定视频动态目标所处位置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国矿业大学(北京),未经中国矿业大学(北京)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110936647.5/1.html,转载请声明来源钻瓜专利网。