[发明专利]一种基于视觉—惯性的物体三维尺寸测量方法有效
申请号: | 202110413394.3 | 申请日: | 2021-04-16 |
公开(公告)号: | CN113034571B | 公开(公告)日: | 2023-01-20 |
发明(设计)人: | 管贻生;林旭滨;杨益枘;何力;张宏 | 申请(专利权)人: | 广东工业大学 |
主分类号: | G06T7/60 | 分类号: | G06T7/60;G06T7/70;G06N3/08;G06N3/0464 |
代理公司: | 广东广信君达律师事务所 44329 | 代理人: | 张生梅 |
地址: | 510062 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 视觉 惯性 物体 三维 尺寸 测量方法 | ||
1.一种基于视觉—惯性的物体三维尺寸测量方法,其特征在于,包括如下步骤:
S1、基于视觉—惯性耦合估计相机的位姿;
S2、提取物体检测框,计算物体检测框对应的反投影平面;
S3、构建对偶椭球包络方程;
S4、计算椭球最小包络盒的三维尺寸,从而获得物体的三维占据空间尺寸信息;
所述步骤S1基于视觉—惯性耦合估计相机的位姿的具体过程如下:
采用视觉—惯性紧耦合框架,包括对图像进行SIFT特征提取和匹配关联;由于IMU和图像的数据频率不同,对图像关键帧Ci到Cj之间的IMU数据进行预积分,积分结果为帧间的IMU姿态ΔR,速度Δv和位置Δp;对于Ci的状态,融合进预积分结果可得Cj下的IMU相对于世界坐标系的姿态R,速度v和位置p;
对于已跟踪的特征点X,利用三角法估计出其三维坐标,对于已经存在于地图中,并且与当前帧特征点建立起数据关联的特征点,加入优化函数之中;
构建视觉重投影误差及IMU惯性误差作为优化代价函数,函数如下:
其中,Eproj(k,j)为视觉传感的代价函数,其定义来自特征点的三维坐标在图像上的重投影误差:
其中{RCB,pCB}是相机坐标系与IMU坐标系的相对变换,用于将第k个特征点在世界坐标系的坐标转换到相机坐标系下的坐标函数是相机成像模型,将三维坐标点映射到图像坐标系中,得到其在图像投影的像素坐标,ρ(·)是核函数Huber函数,用于将原始误差的平方项替换为一个增长较缓的函数,同时保证误差函数的光滑性质;
EIMU(i,j)为IMU误差项:
eb=bj-bi
EIMU(i,j)表示第i帧与第j帧的IMU误差项,包括姿态误差eR、速度误差ev、位置误差ep以及偏移误差eh,其中∑I是预积分的信息矩阵,而∑R是偏移随机游走的信息矩阵;在姿态误差eR中,ΔRij表示通过i、j两个帧的IMU相对变换姿态,表示姿态预积分在j帧的近似修正项,表示IMU通过预积分得到的i-j的相对变换姿态,Log(·)将正交变换群SO(3)的元素映射到李代数so(3)中;在速度误差ev中,和分别表示j帧和i帧的IMU速度在世界坐标系下的表示,gW表示重力矢量,Δvij表示ij两个帧的速度差,而和分别表示陀螺仪和加速度计在j帧的偏移近似项;在位置误差ep中,和分别表示在j帧和i帧的IMU相对于世界坐标系位置,是i帧的IMU线速度在世界坐标系下的表达,Δpij是i、j两个帧的位置差;在偏移项eb中,bj和bi分别表示j、i帧下的IMU偏移量;
通过对上述包含视觉传感和惯性传感误差的方程利用g2o优化框架进行优化求解,求出各关键帧的姿态Rj和位置Pj;
所述步骤S2的具体过程如下:
采用预训练卷积深度神经网络在目标物体数据集上进行训练、微调,得到一个目标物体检测网络模块,该模块将从输入图像中提取目标物体,输出该物体语义标签、2D包络框的坐标及尺寸信息,设该包络框四个顶点记为p1,p2,p3,p4,四条边为l1,l2,l3,l4,均在齐次像素坐标系下表示;在该坐标下,任一点p均有坐标[u,v,1],而任一直线lt可由其上两个点pa及pb的叉乘得到,即:
根据相机成像模型,图像中的直线l反投影得到过相机光心的平面π,则给定第k帧图像平面反投影方程可由相机投影矩阵Pk=K[Rk tk]得到,即:
其中πt=[πt1,πt2,πt3,πt4]T是由lt所得的反投影平面,对所有图像中的物体检测框的四条边均执行此操作,每个检测框均得到四个反投影平面。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110413394.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种轮履复合车轮驱动机构
- 下一篇:一种基于卫浴用防滑预处理限位机构