[发明专利]一种基于OCR字形相近文字识别方法有效
申请号: | 201811211186.X | 申请日: | 2018-10-17 |
公开(公告)号: | CN109447055B | 公开(公告)日: | 2022-05-03 |
发明(设计)人: | 席敬;焦勇;伏虎 | 申请(专利权)人: | 中电万维信息技术有限责任公司 |
主分类号: | G06V30/14 | 分类号: | G06V30/14;G06V30/148;G06V30/19;G06V10/74;G06K9/62 |
代理公司: | 兰州嘉诺知识产权代理事务所(普通合伙) 62202 | 代理人: | 郭海 |
地址: | 730000 甘肃省兰州市城关*** | 国省代码: | 甘肃;62 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及计算机技术领域,特别是涉及模式识别和深度学习领域,更具体地涉及一种基于OCR字形相近文字识别方法。改变传统字形识别方式,对字符文本和字体均可进行识别,通过多样本对比并加入阈值筛选,不仅大幅提升文本识别准确性,而且有效识别字符字体。特别适合相似字形和相似字体的字符识别,实现字形和字体的双重准确识别。通过水平分割和垂直分割将每个字符切割成大小为96*96像素,便于像素特征信息的提取,避免相邻文字间相互干扰,有效提升识别效率,本发明设计人员将书籍、报纸、衣服和截屏等多种图片中每个字符切割成96*96像素进行字符像素特征信息的提取,提取率接近100%。 | ||
搜索关键词: | 一种 基于 ocr 字形 相近 文字 识别 方法 | ||
【主权项】:
1.一种基于OCR字形相近文字识别方法,其特征在于包括如下步骤:A、原始OCR图像预处理对倾斜字符进行文本校正,对图片中的噪声去除,对图像对比度和Gamma校正转化为灰度图像;B、图像文字检测对预处理的灰度图像进行字符像素特征信息的提取,并采用CNN神经网络进行字符像素特征信息的提取将其转化为独热编码形式的特征向量,作为字符识别模块字符像素特征信息识别的依据;C、识别计算使用标准字库的不同字体作为训练样本n,标准字库的每种不同字体记为n1、n2、、、,计算出训练样本每种字体的欧氏距离Dn1、Dn2、、、, 字符识别模块采用google‑Inception‑v4构架,对待识别图像文字进行识别作为识别样本p,计算出识别样本p的欧式距离DP,使用如下公式计算出识别样本与不同字体训练样本对比阈值a,
、
、、、;D、字符文本字体识别选择对比阈值a1、a2、、、中0.4‑0.6的一个训练样本,输出相对应的识别字符的文本和字体。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中电万维信息技术有限责任公司,未经中电万维信息技术有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811211186.X/,转载请声明来源钻瓜专利网。