[发明专利]一种文本识别方法、文本识别装置及终端设备在审
申请号: | 202011580119.2 | 申请日: | 2020-12-28 |
公开(公告)号: | CN112668580A | 公开(公告)日: | 2021-04-16 |
发明(设计)人: | 魏政;曹瑾;孙圆 | 申请(专利权)人: | 南京航天数智科技有限公司 |
主分类号: | G06K9/34 | 分类号: | G06K9/34;G06K9/32;G06N3/08 |
代理公司: | 深圳中一联合知识产权代理有限公司 44414 | 代理人: | 肖遥 |
地址: | 210000 江苏省南京市雨花*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文本 识别 方法 装置 终端设备 | ||
本申请适用于人工智能技术领域,提供了一种文本识别方法、文本识别装置、终端设备及计算机可读存储介质,所述方法包括获取待识别的文本图像,所述文本图像中包含噪声信息;利用训练后的第一神经网络模型消除所述噪声信息的干扰并分割所述文本图像,得到所述文本图像的文本区域;利用训练后的第二神经网络模型对所述文本区域进行文字识别,得到文字识别结果;根据所述文本图像和所述文字识别结果生成文件。通过上述方法,可以实现对政法领域的文本图像的文字识别,且识别的准确度高。
技术领域
本申请属于人工智能技术领域,尤其涉及一种文本识别方法、文本识别装置、终端设备及计算机可读存储介质。
背景技术
目前,在政法领域中存在各种各样的文本图像,例如,文本图像的文本区域存在断笔、粘连、阴影和污点等噪声;由于纸张的厚薄、光洁度和印刷质量造成文本区域的文字的畸变以及文本行的倾斜等;由于政法领域的文本图像的特殊性,文本区域存在指纹、印章和邮戳等。相关技术中,对政法领域的文本区域进行文字识别的难度大,且识别的准确度低。
发明内容
有鉴于此,本申请提供了一种文本识别方法、文本识别装置、终端设备及计算机可读存储介质,可以实现对政法领域的文本图像的文字识别,且识别的准确度高。
第一方面,本申请提供了一种文本识别方法,包括:
获取待识别的文本图像,上述文本图像中包含噪声信息;
利用训练后的第一神经网络模型消除上述噪声信息的干扰并分割上述文本图像,得到上述文本图像的文本区域;
利用训练后的第二神经网络模型对上述文本区域进行文字识别,得到文字识别结果;
根据上述文本图像和上述文字识别结果生成文件。
第二方面,本申请提供了一种文本识别装置,包括:
获取单元,用于获取待识别的文本图像,上述文本图像中包含噪声信息;
分割单元,用于利用训练后的第一神经网络模型消除上述噪声信息的干扰并分割上述文本图像,得到上述文本图像的文本区域;
识别单元,用于利用训练后的第二神经网络模型对上述文本区域进行文字识别,得到文字识别结果;
生成单元,用于根据上述文本图像和上述文字识别结果生成文件。
第三方面,本申请提供了一种终端设备,包括存储器、处理器以及存储在上述存储器中并可在上述处理器上运行的计算机程序,上述处理器执行上述计算机程序时实现如上述第一方面所提供的方法的步骤。
第四方面,本申请提供了一种计算机可读存储介质,上述计算机可读存储介质存储有计算机程序,上述计算机程序被处理器执行时实现如第一方面所提供的方法的步骤。
第五方面,本申请提供了一种计算机程序产品,当计算机程序产品在终端设备上运行时,使得终端设备执行上述第一方面所提供的方法的步骤。
由上可见,本申请方案中,首先获取待识别的文本图像,上述文本图像中包含噪声信息,然后利用训练后的第一神经网络模型消除上述噪声信息的干扰并分割上述文本图像,得到上述文本图像的文本区域,利用训练后的第二神经网络模型对上述文本区域进行文字识别,得到文字识别结果,最后根据上述文本图像和上述文字识别结果生成文件。本申请方案通过第一神经网络模型消除文本图像的噪声的干扰,精确地分割得到文本区域,然后利用第二神经网络模型对文本区域进行文字识别,由于消除了噪声的干扰,因此得到的文字识别结果较为准确,从而实现了对政法领域的文本图像的文字识别,且识别的准确度高。可以理解的是,上述第二方面至第五方面的有益效果可以参见上述第一方面中的相关描述,在此不再赘述。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京航天数智科技有限公司,未经南京航天数智科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011580119.2/2.html,转载请声明来源钻瓜专利网。