[发明专利]文字识别方法、装置、设备和计算机可读介质在审

申请号：	201911019483.9	申请日：	2019-10-24
公开（公告）号：	CN110942061A	公开（公告）日：	2020-03-31
发明（设计）人：	丁笑天	申请（专利权）人：	泰康保险集团股份有限公司
主分类号：	G06K9/20	分类号：	G06K9/20;G06K9/62
代理公司：	中原信达知识产权代理有限责任公司 11219	代理人：	郭晗;赵迪
地址：	100031 北京市西***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	文字识别方法装置设备计算机可读介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了文字识别方法、装置、设备和计算机可读介质，涉及计算机技术领域。该方法的一具体实施方式包括：利用光学字符识别OCR，获取待匹配图像中多个文本块和多个文本块位置；所述多个文本块包括文字模板中多个关键词，所述多个文本块之间以直线连接，按照所述文本块位置确定所述文本块之间的线段信息和角度信息；基于所述文本块之间的线段信息和角度信息，生成所述待匹配图像的特征向量；所述待匹配图像的特征向量与所述文字模板的特征向量之间的距离小于预设距离阈值，则按照所述文字模板中关键词的识别区域，提取所述待匹配图像中待识别区域的文字。该实施方式能够保障与文字模板匹配成功，进而识别文字。

技术领域

本发明涉及计算机技术领域，尤其涉及一种文字识别方法、装置、设备和计算机可读介质。

背景技术

光学字符识别(Optical Character Recognition，OCR)技术，能够对包含文字的图像进行识别，将其中的文字转化为可检索的信息。即，搜索影像件中的文字区域，并将其识别为计算机能够表示的文字信息。

OCR技术通常应用在舆情监控、文档检索、字幕识别、截图识别、网络图片识别、文献资料检索、无纸化办公和稿件编辑校对等领域。在公司办公过程中集成OCR识别技术之后，不仅仅是提高了办事效率，也方便电子化存储和管理，包括后期查阅检索、编辑管理等。

目前，OCR技术随着深度学习神经网络的发展，可以基于模板匹配以识别图像中文字。

在实现本发明过程中，发明人发现现有技术中至少存在如下问题：模板匹配中，要求图像无缩放并且文字是尽可能水平的。当待匹配图像与文字模板相比，带有缩放或者旋转时，会出现不能匹配的情况，导致无法识别文字。

发明内容

有鉴于此，本发明实施例提供一种文字识别方法、装置、设备和计算机可读介质，当待识别图像与文字模板相比，带有缩放或者旋转时，能够保障与文字模板匹配成功，进而识别文字。

为实现上述目的，根据本发明实施例的一个方面，提供了一种文字识别方法，包括：

利用光学字符识别OCR，获取待匹配图像中多个文本块和多个文本块位置；

所述多个文本块包括文字模板中多个关键词，所述多个文本块之间以直线连接，按照所述文本块位置确定所述文本块之间的线段信息和角度信息；