[发明专利]一种文本识别的方法、装置、电子设备和存储介质在审

申请号：	202010524228.6	申请日：	2020-06-10
公开（公告）号：	CN111680635A	公开（公告）日：	2020-09-18
发明（设计）人：	韦文杰;邓小兵;张春雨	申请（专利权）人：	广东小天才科技有限公司
主分类号：	G06K9/00	分类号：	G06K9/00;G06K9/20;G06K9/34;G06N3/04;G06N3/08
代理公司：	广州智斧知识产权代理事务所(普通合伙) 44649	代理人：	孔德超
地址：	528850 广东省东***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种文本识别方法装置电子设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明实施例涉及OCR技术领域，公开了一种文本识别的方法、装置、电子设备和存储介质。该方法包括：获取目标文本图像；得到目标文本图像的题号框、公式框和文本行轮廓；利用题号框对公式框进行过滤，利用文本行轮廓过滤题号框，将过滤后的公式框插入文本行轮廓中，得到文本位置信息；对插入公式框的文本行轮廓进行矫正；将矫正后的文本行轮廓中的文本送入中英文识别模型进行识别，将公式框中的公式送入公式识别模型；保存文本位置信息、公式识别结果和文字识别结果。实施本发明实施例，在文本行识别的基础上，引入题号检测和公式检测，丰富了OCR的功能，可以自动检测和识别出题号、公式和文本行的位置信息和文字信息。

技术领域

本发明涉及OCR技术领域，具体涉及一种文本识别的方法、装置、电子设备和存储介质。

背景技术

传统的OCR识别是通过文本行检测后进行识别，这种方式在一般场景中的字符识别能够满足需求，但是在教育领域，例如试卷、练习册以及作业本等文本处理的光学文字识别场景中，其不同于通用OCR场景，需要对试卷文本中的题号和公式进行位置进行检测，并对题号和公式信息进行识别，现有技术无法满足这种需求。

发明内容

针对所述缺陷，本发明实施例公开了一种文本识别的方法、装置、电子设备和存储介质，其可以获取文本行、题号以及公式的位置信息，以及文本、题号以及公式的识别。

本发明实施例第一方面公开一种文本识别的方法，所述方法包括：

获取目标文本图像；

将所述目标文本图像并行输入题号检测网络模型、公式检测网络模型以及文本行检测网络模型，分别输出题号框、公式框和文本行轮廓；

利用所述题号框对所述公式框进行过滤，利用所述文本行轮廓过滤所述题号框，将过滤后的公式框插入文本行轮廓中，得到文本位置信息；

对所述插入公式框的文本行轮廓进行矫正，得到矫正后的文本行轮廓；

将所述矫正后的文本行轮廓中的文本送入中英文识别模型进行识别，将所述公式框中的公式送入公式识别模型，分别得到文字识别结果和公式识别结果；