[发明专利]一种车胎文本检测和识别方法有效
申请号: | 202011008188.6 | 申请日: | 2020-09-23 |
公开(公告)号: | CN112883957B | 公开(公告)日: | 2022-04-22 |
发明(设计)人: | 刘远超;吴宗林;黄俊俊;姜世强;陈钦鸿 | 申请(专利权)人: | 浙江浩腾电子科技股份有限公司 |
主分类号: | G06V20/62 | 分类号: | G06V20/62;G06V30/10;G06N3/04 |
代理公司: | 杭州浙科专利事务所(普通合伙) 33213 | 代理人: | 周红芳 |
地址: | 323000 浙江省丽水市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 车胎 文本 检测 识别 方法 | ||
1.一种车胎文本检测和识别方法,其特征在于,包括如下步骤:
步骤1:通过深度神经网络对车胎侧面文字进行检测,得到的结果记为R={rk|k=1,2,…,K},定义分布邻近的一组字符为组合字符簇,在R中,rk表示检测到的第k个组合字符簇的最小外接矩形包围框,K表示检测到的组合字符簇的数量;
步骤2:定义集合C={pk=(xk,yk)|k=1,2,…,K},其中,pk为rk的中心点;将集合C中的坐标代入式(1)中,通过式(2),(3),拟合得到圆曲线方程x2+y2+ax+by+c=0的参数a,b,c及其圆心坐标(x0,y0),其中,
A=(XT·X)-1·XT·Y (3)
式中,δ表示事先选定的拟合误差阈值,Q(A)表示矩阵形式的圆曲线方程表达式;
步骤3:记rk所包围的图像为Ik,通过转换Ik来将图像中弯曲的文本行拉直,具体为:
步骤3.1:根据公式(4)得到pk相对于拟合的圆曲线方程的圆心(x0,y0)的角度θk;
根据(5)给出的规则翻转Ik,得到的图像记为I′k;
步骤3.2:通过深度神经网络对I′k检测,得到的结果记为Q={qi|i=1,2,…,N},其中,qi表示I′k中检测到的第i个字符所在的最小外接旋转矩形框,N表示I′k中检测到的字符的数量;定义集合T={ti|i=1,2,…,N},其中ti表示qi的顶边中点;定义集合B={bi|i=1,2,…,N},其中bi表示qi的底边中点;
步骤3.3:扩充集合T:t1为I′k中最左侧的点,通过公式(6),将点Tl加入T中t1之前;tN为I′k中最右侧的点,通过公式(7),将点Tr加入T中tN之后,Tl、Tr分别表示扩充后的集合T中最左侧和最右侧的点;
当存在间隔较远的两个字符时,在集合T加入一个控制点:当T中相邻两点ti和ti+1之间的距离时,根据公式(8)将点Pm加入点集T中,且Pm排列于ti和ti+1之间,其中,Pm表示在大间隔字符之间加入的点,Wt满足公式(9);
最终扩充后的控制点集合T={ti|i=1,2,…,N+2+K0},其中K0表示在较大间隔处添加的控制点的数量;
步骤3.4:采用步骤3.3同样的方法扩充得到集合B={bi|i=1,2,…,N+2+K0};T和B构成图像I′k中的控制点集;
步骤3.5:将待生成的目标图像记为I″k,构造生成I″k的控制点集:构建分布在I″k上沿的点集T′={t′i=((i-1)×dk,0)|i=1,2,...,N};构建分布在I″k下沿的点集B′={b′i=((i-1)×dk,Hk)|i=1,2,...,N},其中,点间距dk和图像I″k的高度Hk根据公式(10)计算得到;
式中,Hi、Wi分别表示qi的高度与宽度,a为常数系数;
步骤3.6:定义集合TB={{(ti,t′i),(bi,b′i)}|i=1,2,...,N},其中(ti,t′i)表示ti和t′i组成的控制点对,(bi,b′i)表示bi和b′组成的控制点对;将TB中的控制点对代入TPS样条插值函数实现图像Ik到图像I″k的转换;转换后的图像I″k为平直的矩形图像,在I″k中的内容为被拉直后水平排列的文字;
步骤4:将图像I″k输入文字识别模型,输出文本识别的结果;
步骤5:重复步骤3和步骤4,最终得到车胎上全部文本的识别结果;根据车胎文本的排列规范,能够得到车胎或车辆信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江浩腾电子科技股份有限公司,未经浙江浩腾电子科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011008188.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:家电系统、家电设备、影像设备、外部服务器及显示方法
- 下一篇:雨刷装置