[发明专利]一种扭曲文档的文字识别方法、装置及存储介质在审

申请号：	202011497123.2	申请日：	2020-12-17
公开（公告）号：	CN114648764A	公开（公告）日：	2022-06-21
发明（设计）人：	成龙;吴秦龙	申请（专利权）人：	中移(苏州)软件技术有限公司;中国移动通信集团有限公司
主分类号：	G06V30/148	分类号：	G06V30/148;G06V30/146
代理公司：	北京派特恩知识产权代理有限公司 11270	代理人：	钟文聪;张颖玲
地址：	215163 江苏***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种扭曲文档文字识别方法装置存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请实施例提供了一种扭曲文档的文字识别方法、装置以及存储介质；其中，所述方法用于：根据预设的分割模型分割出待识别的文字图像中的文字行，得到所述文字行的掩码图像；根据所述掩码图像，对文字行进行扭曲分析，确定所述文字行与水平文字行的映射关系模型；根据所述映射关系模型，对呈曲线分布的所述文字行进行校正，得到校正后呈直线分布的文字行；识别校正后的文字行中的文字。

技术领域

本发明涉及云智融合领域，尤其涉及一种扭曲文档的文字识别方法、装置及存储介质。

背景技术

图片识别在智能识别领域具有十分重要的意义，随着科技的进步和社会的发展，对图片中文字的自动识别的需求量也急速增加。在通过扫描、拍摄等手段采集得到的图像的过程中，由于采集角度、文档源本身物理因素等影响，图像发生扭曲，对识别过程带来了困难。

现有技术方案中，需要对于扭曲文档图像进行多个区域的拆分、校正、合并，存在边缘像素点无法完全匹配的问题。且该方案在文档识别过程中需要对文档中文字行逐一计算拉直处理，消耗大量的计算资源，性能较低。

发明内容

本发明实施例提供一种扭曲文档的文字识别方法、装置及存储介质。

本发明实施例技术方案是这样实现的：

本发明实施例提供一种扭曲文档的文字识别方法，包括：

根据预设的分割模型分割出待识别的文字图像中的文字行，得到所述文字行的掩码图像；

根据所述掩码图像，对文字行进行扭曲分析，确定所述文字行与水平文字行的映射关系模型；

根据所述映射关系模型，对呈曲线分布的所述文字行进行校正，得到校正后呈直线分布的文字行；