[发明专利]一种基于视觉高效OCR识别算法在审
申请号: | 201810402553.8 | 申请日: | 2018-04-28 |
公开(公告)号: | CN108564064A | 公开(公告)日: | 2018-09-21 |
发明(设计)人: | 欧阳德寿 | 申请(专利权)人: | 北京宙心科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46 |
代理公司: | 北京七夏专利代理事务所(普通合伙) 11632 | 代理人: | 王晓丰 |
地址: | 102400 北京市房*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及图像处理技术领域,具体的讲涉及一种基于视觉高效OCR识别算法,包括步骤一:字符训练;所述字符训练包括:(a)图像预处理;(b)文字定位;(c)骨架提取;(d)特征提取;得到一个模型数据,将模型数据保存到模型文件中;步骤二:字符识别;所述字符识别读取所述(d)步中训练保存的模型文件,经过步骤一中的(a)、(b)、(c)、(d)步提取文字RILBP特征后,归一化处理,得RILBP数据使用SVM进行分类识别;从识别结果中选择相似度最高且达到一定相似度的结果为最终识别结果;本算法运行速度快,识别率高,不依赖任何第三方库,可移植性强,能在普通Arm嵌入式平台运行。从而在机器人等领域产品大大降低平台成本。 | ||
搜索关键词: | 算法 模型数据 模型文件 字符识别 相似度 视觉 图像处理技术 读取 归一化处理 图像预处理 分类识别 骨架提取 可移植性 领域产品 数据使用 特征提取 第三方 识别率 保存 机器人 | ||
【主权项】:
1.一种基于视觉高效OCR识别算法,其特征在于,包括以下两个步骤:步骤一:字符训练;所述字符训练包括:(a)图像预处理;提取图像灰度图,然后计算灰度图阈值,根据阈值将灰度图进行二值化;(b)文字定位;通过临近连通区域搜索方法定位文字区域,定位到文字位置,截取文字区域,并进行缩放;(c)骨架提取;不同场景下,文字笔画粗细不一,将文字线条细化,提取特征统一都使用细化后的图像数据,得到预处理后的数据;(d)特征提取;提取数据的RILBP特征,归一化处理,数据经过数据标准化处理后,各指标处于同一数量级,适合进行综合对比评价;将所有字符RILBP特征组成多个特征向量样本集,使用支持向量机SVM进行分类训练;分类训练完成后得到一个模型数据,将模型数据保存到模型文件中;步骤二:字符识别;所述字符识别读取所述(d)步中训练保存的模型文件,从摄像头获取图像数据;经过所述步骤一中的(a)、(b)、(c)、(d)步提取文字RILBP特征后,进行归一化处理,将归一化得RILBP数据使用SVM进行分类识别;从识别结果中选择相似度最高且达到一定相似度的结果为最终识别结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京宙心科技有限公司,未经北京宙心科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810402553.8/,转载请声明来源钻瓜专利网。