[发明专利]一种文字识别编校方法在审
申请号: | 201810493009.9 | 申请日: | 2018-05-22 |
公开(公告)号: | CN108710855A | 公开(公告)日: | 2018-10-26 |
发明(设计)人: | 员战强;王长征;胡志强;师峰;刘文晓;梁询 | 申请(专利权)人: | 山西同方知网数字出版技术有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32;G06K9/54;G06F17/27 |
代理公司: | 北京天奇智新知识产权代理有限公司 11340 | 代理人: | 刘黎明 |
地址: | 030006 山西省太*** | 国省代码: | 山西;14 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文字识别 图像预处理 文档图片 文档 错误率控制 归一化处理 识别系统 文字结果 文字内容 自动纠正 量控制 多路 引擎 | ||
本发明公开了一种文字识别编校方法,包括:对文档图片进行图像预处理;对图像预处理后的文档图片通过多路识别引擎对文档中的文字进行识别,得到文字识别结果;对识别的文字结果进行归一化处理;自动纠正识别的文字内容;对识别存疑的内容进行人工编校。本发明对以文字为主体的文档的识别系统错误率控制在0.005%‑0.3%,并且,在人工编校工作中,可将需要人工编校的文字量控制在3%‑5%。
技术领域
本发明涉及纸质资料数字化出版领域,同时适用于识别结果优化算法设计技术领域,尤其涉及一种高可信的文字识别编校方法。
背景技术
现有当前文字识别系统很多,存在识别后文字正确率低的问题,人工编校任务量大,需要较高的人工成本。因此,一个高可信的文字识别编校方法对于提高的文字识别可信度、降低人工编校成本有着非常重要的作用。
发明内容
为解决上述技术问题,本发明的目的是提供一种高可信文字识别编校方法,该方法基于多路识别结果取最优结果的算法设计,解决识别后文字正确率低的问题,降低了人工编校成本。
本发明的目的通过以下的技术方案来实现:
一种文字识别编校方法,包括:
A对文档图片进行图像预处理;
B对图像预处理后的文档图片通过多路识别引擎对文档中的文字进行识别,得到文字识别结果;
C对识别的文字结果进行“归一化”处理;
D自动纠正识别的文字内容;
E对识别存疑的内容进行人工编校。
与现有技术相比,本发明的一个或多个实施例可以具有如下优点:
对以文字为主体的文档的识别系统错误率控制在0.005%-0.3%,并且,在人工编校工作中,可将需要人工编校的文字量控制在3%-5%。
附图说明
图1是文字识别编校方法流程图;
图2是位置归一化示意图;
图3是内容归一化示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合实施例及附图对本发明作进一步详细的描述。
如图1所示,为文字识别编校方法流程,包括
对文档图片进行图像预处理;
为了提高识别引擎的识别正确率,对文档进行统一去背景色、纠偏、去噪、图像灰度化、图像二值化、去下划线及去边框的处理。
对图像预处理后的文档图片通过多路识别引擎对文档中的文字进行识别,得到文字识别结果;
对识别的文字结果进行归一化处理;
经过多路识别得到多家识别结果,以识别准确率高的一家(A路识别)的识别结果为基准,与其他识别结果从位置上进行交叉比对归一、内容上相互比对归一,最终形成一份识别比对结果。上述文字位置上交叉比对归一,通过多路识别的结果比对,记录其属性特征,包括删除del,增加add,替换replace,相同equal,上、下行中心距离centerLineHeight,上、下行1/2行高的和lineHeightSum,上下行间距lineSpace,平均行高aveLineHeight,分析其属性特征,得出如下结论:
当行数不一致时:
若多行(del),则根据版式特征满足centerLineHeight>lineHeightSum则判定为无效行并删除,反之,当满足lineSpace>aveLineHeight/2则判定为无效行并删除;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山西同方知网数字出版技术有限公司,未经山西同方知网数字出版技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810493009.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:人脸识别方法及装置
- 下一篇:一种基于视频流的人脸识别方法