[发明专利]一种基于深度相机的目标文本点云图像识别矫正方法在审

专利信息
申请号: 202111385478.7 申请日: 2021-11-22
公开(公告)号: CN114120312A 公开(公告)日: 2022-03-01
发明(设计)人: 高飞;王英杰;卢书芳;翁立波 申请(专利权)人: 浙江工业大学
主分类号: G06V20/64 分类号: G06V20/64;G06V30/146
代理公司: 杭州浙科专利事务所(普通合伙) 33213 代理人: 周红芳
地址: 310006 浙江省*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 深度 相机 目标 文本 云图 识别 矫正 方法
【权利要求书】:

1.一种基于深度相机的目标文本点云图像识别矫正方法,其特征在于包括如下步骤:

步骤1:记深度相机采集图像的矩形框为box1、包含目标文本的矩形框为box2,box1和box2中心点相同,且box1包含box2;其中,box2的宽度和高度分别记为w和h;

步骤2:使用深度相机获取box2包含的点云和box1包含的RGB图像,其中,box2包含的点云记为集合P={Ai=(xi,yi,zi)|i=1,2,...,n},box1包含的图像记为Q,深度相机出厂时给定的内参矩阵为I;其中,Ai表示box2包含的第i个点云,(xi,yi,zi)表示第i个点云的三维坐标,n表示box2包含的点云数量;

步骤3:根据式(1)计算得到图像Q的像素点坐标与P中的点云坐标对应关系;

k=y*w+x (1)

其中,(x,y)表示图像Q的任意像素点的坐标,k表示(x,y)对应于点云集合P中点云的下标,即(x,y)对应于Ak=xk,yk,zk,k∈{1,2,…,n};

步骤4:根据字符检测算法计算得到仅包含目标字符串的包络矩形框,记为box3,并从左上角开始按顺时针方向记录box3的4个顶点为Ba1、Ba2、Ba3和Ba4;利用式(1)找到Ba1、Ba2、Ba3和Ba4对应的点云,分别记为Ab1、Ab2、Ab3和Ab4;按顺时针连接Ab1、Ab2、Ab3和Ab4四个点云,从集合P中分割出对应于box3的点云并构成点云集合P0,根据式(2)得到点云集合P0的形心Op

其中,(xc,yc,zc)表示点云集合P0的形心Op的坐标,(xb1,yb1,zb1)、(xb2,yb2,zb2)、(xb3,yb3,zb3)和(xb4,yb4,zb4)分别表示Ab1、Ab2、Ab3和Ab4的坐标;

步骤5:以点云集合P0为输入,建立统计分析滤波器,根据点云统计滤波算法滤除离散点云,得到新的点云集合Pa

步骤6:以点云集合Pa作为输入,建立KD树进行近邻点集搜索,根据搜索到的近邻点集并利用PCL求解每个点云的法向量,得到如式(3)所示的法向量集合F0,再根据式(4)得到点云集合Pa的平面平均法向量

其中,vxi、vyi和vzi分别表示法向量在X轴、Y轴和Z轴上的值;vx0、vy0和vz0分别表示平均法向量在X轴、Y轴和Z轴上的值,m表示当前所输入点云集合的点云总数;

步骤7:遍历集合F0,根据式(5)得到每个和的夹角anglei,将所有角度anglei小于5度的索引i保存为一维数组,将角度anglei大于5度的索引i对应的点云过滤,利用PCL根据索引复制点云的方法得到索引i相对应的点云并进行聚类,记为点云集合Pb,统计Pb的点云数量,记为N;

其中,anglei表示第i个点云的法向量与平均法向量之间的夹角;·表示向量点乘;

步骤8:若点云集合Pb的点云总数N与当前点云集合Pa的点云总数m相等,则表示过滤完全,令Pa=Pb,转步骤9;否则,令Pa=Pb,Pb=Φ,转步骤6;

步骤9:根据式(6)得到过滤完全后的点云集合Pa的平均法向量和之间的夹角angle,根据式(7)得到点云P0的平面旋转轴axis,并将旋转轴axis归一化;

其中,×表示向量叉乘,表示图像Q矫正后的平面法向量;

步骤10:根据式(8)得到平移矩阵TR,根据式(9)计算出将图像Q转换到矫正后的图像的透视变换矩阵H;

H=I·R·TR·I-1 (9)

其中,I-1表示相机内参矩阵的逆矩阵,R表示根据angle和axis并采用PCL方法计算得到的旋转矩阵;

步骤11:针对box2中的字符串,根据式(10)得到图像Q中对应于box2的矫正后的子图像,记为Qr

其中,(us,vs,1)表示box2的4个顶点的图像坐标的齐次坐标,(urs,vrs,1)表示矫正后4个顶点对应图像坐标的齐次坐标;

步骤12:根据矫正后Qr的四个顶点的齐次坐标重新裁剪ROI区域,根据式(1)得到四个顶点对应的点云,重新计算该ROI区域的4个顶点的世界坐标,根据结构化点云和图像实际长宽保持一致的要求,得到矫正后的目标文本的实际长宽,即实现了目标文本对应图像的矫正。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111385478.7/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top