[发明专利]一种基于视觉高效OCR识别算法在审

专利信息
申请号: 201810402553.8 申请日: 2018-04-28
公开(公告)号: CN108564064A 公开(公告)日: 2018-09-21
发明(设计)人: 欧阳德寿 申请(专利权)人: 北京宙心科技有限公司
主分类号: G06K9/00 分类号: G06K9/00;G06K9/46
代理公司: 北京七夏专利代理事务所(普通合伙) 11632 代理人: 王晓丰
地址: 102400 北京市房*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 算法 模型数据 模型文件 字符识别 相似度 视觉 图像处理技术 读取 归一化处理 图像预处理 分类识别 骨架提取 可移植性 领域产品 数据使用 特征提取 第三方 识别率 保存 机器人
【说明书】:

发明涉及图像处理技术领域,具体的讲涉及一种基于视觉高效OCR识别算法,包括步骤一:字符训练;所述字符训练包括:(a)图像预处理;(b)文字定位;(c)骨架提取;(d)特征提取;得到一个模型数据,将模型数据保存到模型文件中;步骤二:字符识别;所述字符识别读取所述(d)步中训练保存的模型文件,经过步骤一中的(a)、(b)、(c)、(d)步提取文字RILBP特征后,归一化处理,得RILBP数据使用SVM进行分类识别;从识别结果中选择相似度最高且达到一定相似度的结果为最终识别结果;本算法运行速度快,识别率高,不依赖任何第三方库,可移植性强,能在普通Arm嵌入式平台运行。从而在机器人等领域产品大大降低平台成本。

技术领域

本发明涉及图像处理技术领域,具体的讲涉及一种基于视觉高效OCR识别算法。

背景技术

目前,用于机器视觉人工智能的算法,主要基于OpenCV、Python等支持平台,而对于一些普通智能需求来说,基于高端处理器成本高、功耗高、体积大,难以产品化。

然而,现有的一些识别算法,识别率低,效率低下,依赖OpenCV等开源库,需要运行在成本较高的高端处理器上。

发明内容

因此本发明提出一种基于视觉高效OCR识别算法,用来解决上述背景技术中的问题。

本发明的技术方案是这样实现的:一种基于视觉高效OCR识别算法,包括以下两个步骤:

步骤一:字符训练;

所述字符训练包括:

(a)图像预处理;提取图像灰度图,然后计算灰度图阈值,根据阈值将灰度图进行二值化;

(b)文字定位;通过临近连通区域搜索方法定位文字区域,定位到文字位置,截取文字区域,并进行缩放;

(c)骨架提取;不同场景下,文字笔画粗细不一,将文字线条细化,提取特征统一都使用细化后的图像数据,得到预处理后的数据;

(d)特征提取;提取数据的RILBP特征,归一化处理,数据经过数据标准化处理后,各指标处于同一数量级,适合进行综合对比评价;将所有字符RILBP特征组成多个特征向量样本集,使用SVM进行分类训练;分类训练完成后得到一个模型数据,将模型数据保存到模型文件中;

步骤二:字符识别;

所述字符识别读取所述(d)步中训练保存的模型文件,从摄像头获取图像数据;经过所述步骤一中的(a)、(b)、(c)、(d)步提取文字RILBP特征后,进行归一化处理,将归一化得RILBP数据使用SVM进行分类识别;从识别结果中选择相似度最高且达到一定相似度的结果为最终识别结果。

进一步地,所述步骤一中的(d)特征提取步骤采用旋转不变RILBP特征,取n*n像素的邻域,以邻域中心像素为阈值,周围相邻m个像素的灰度值与阈值进行比较。

进一步地,所述灰度值与阈值进行比较,当周围像素大于阈值,则该像素点的位置被标记为1,小于等于阈值则为0。

进一步地,所述n*n邻域内的m个像素点经过与阈值比较可得到m位二进制数,将这8位二进制数按顺时针方向依次排列形成一个二进制数值,即得中心像素的RILBP值。

进一步地,所述RILBP值共有2m种可能,中心像素的RILBP值反映了该像素周围区域的纹理信息,然后不断的旋转圆形邻域内的RILBP特征,得到一系列RILBP特征值,选择RILBP特征值最小的作为中心像素点的RILBP特征。

进一步地,所述步骤二中字符识别包括结果的容错和纠错,处理方法为首先做一个容错过滤处理,把识别出的数字号码中所有特殊字符去除,并针对不同的RILBP特征,对数字号码再进行一次容错、纠错处理,得到一个经过滤的识别结果。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京宙心科技有限公司,未经北京宙心科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810402553.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top