[发明专利]一种文本识别方法、文本识别装置及终端设备在审

申请号：	202011580119.2	申请日：	2020-12-28
公开（公告）号：	CN112668580A	公开（公告）日：	2021-04-16
发明（设计）人：	魏政;曹瑾;孙圆	申请（专利权）人：	南京航天数智科技有限公司
主分类号：	G06K9/34	分类号：	G06K9/34;G06K9/32;G06N3/08
代理公司：	深圳中一联合知识产权代理有限公司 44414	代理人：	肖遥
地址：	210000 江苏省南京市雨花***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种文本识别方法装置终端设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请适用于人工智能技术领域，提供了一种文本识别方法、文本识别装置、终端设备及计算机可读存储介质，所述方法包括获取待识别的文本图像，所述文本图像中包含噪声信息；利用训练后的第一神经网络模型消除所述噪声信息的干扰并分割所述文本图像，得到所述文本图像的文本区域；利用训练后的第二神经网络模型对所述文本区域进行文字识别，得到文字识别结果；根据所述文本图像和所述文字识别结果生成文件。通过上述方法，可以实现对政法领域的文本图像的文字识别，且识别的准确度高。

技术领域

本申请属于人工智能技术领域，尤其涉及一种文本识别方法、文本识别装置、终端设备及计算机可读存储介质。

背景技术

目前，在政法领域中存在各种各样的文本图像，例如，文本图像的文本区域存在断笔、粘连、阴影和污点等噪声；由于纸张的厚薄、光洁度和印刷质量造成文本区域的文字的畸变以及文本行的倾斜等；由于政法领域的文本图像的特殊性，文本区域存在指纹、印章和邮戳等。相关技术中，对政法领域的文本区域进行文字识别的难度大，且识别的准确度低。

发明内容

有鉴于此，本申请提供了一种文本识别方法、文本识别装置、终端设备及计算机可读存储介质，可以实现对政法领域的文本图像的文字识别，且识别的准确度高。

第一方面，本申请提供了一种文本识别方法，包括：

获取待识别的文本图像，上述文本图像中包含噪声信息；

利用训练后的第一神经网络模型消除上述噪声信息的干扰并分割上述文本图像，得到上述文本图像的文本区域；

利用训练后的第二神经网络模型对上述文本区域进行文字识别，得到文字识别结果；

根据上述文本图像和上述文字识别结果生成文件。

第二方面，本申请提供了一种文本识别装置，包括：

获取单元，用于获取待识别的文本图像，上述文本图像中包含噪声信息；

分割单元，用于利用训练后的第一神经网络模型消除上述噪声信息的干扰并分割上述文本图像，得到上述文本图像的文本区域；

识别单元，用于利用训练后的第二神经网络模型对上述文本区域进行文字识别，得到文字识别结果；

生成单元，用于根据上述文本图像和上述文字识别结果生成文件。

第三方面，本申请提供了一种终端设备，包括存储器、处理器以及存储在上述存储器中并可在上述处理器上运行的计算机程序，上述处理器执行上述计算机程序时实现如上述第一方面所提供的方法的步骤。

第四方面，本申请提供了一种计算机可读存储介质，上述计算机可读存储介质存储有计算机程序，上述计算机程序被处理器执行时实现如第一方面所提供的方法的步骤。

第五方面，本申请提供了一种计算机程序产品，当计算机程序产品在终端设备上运行时，使得终端设备执行上述第一方面所提供的方法的步骤。

由上可见，本申请方案中，首先获取待识别的文本图像，上述文本图像中包含噪声信息，然后利用训练后的第一神经网络模型消除上述噪声信息的干扰并分割上述文本图像，得到上述文本图像的文本区域，利用训练后的第二神经网络模型对上述文本区域进行文字识别，得到文字识别结果，最后根据上述文本图像和上述文字识别结果生成文件。本申请方案通过第一神经网络模型消除文本图像的噪声的干扰，精确地分割得到文本区域，然后利用第二神经网络模型对文本区域进行文字识别，由于消除了噪声的干扰，因此得到的文字识别结果较为准确，从而实现了对政法领域的文本图像的文字识别，且识别的准确度高。可以理解的是，上述第二方面至第五方面的有益效果可以参见上述第一方面中的相关描述，在此不再赘述。

附图说明

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于南京航天数智科技有限公司，未经南京航天数智科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202011580119.2/2.html，转载请声明来源钻瓜专利网。

上一篇：一种高密度发酵生产L-赖氨酸的培养基及其方法
下一篇：一种用于高温存储的隔膜及其制备方法和锂离子电池

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种文本识别方法、文本识别装置及终端设备在审

专利文献下载