[发明专利]一种印章提取及文字识别的方法及装置在审
申请号: | 202011026136.1 | 申请日: | 2020-09-25 |
公开(公告)号: | CN112329756A | 公开(公告)日: | 2021-02-05 |
发明(设计)人: | 董朝阳;罗书培;洪勇;晏世武 | 申请(专利权)人: | 武汉光谷信息技术股份有限公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/32;G06K9/34;G06K9/46;G06K9/62;G06N3/04;G06N3/08;G06T5/00;G06T7/62;G06T3/60;G06T3/40 |
代理公司: | 武汉蓝宝石专利代理事务所(特殊普通合伙) 42242 | 代理人: | 方菲 |
地址: | 430000 湖北省武汉市东湖新技术*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 印章 提取 文字 识别 方法 装置 | ||
本发明提供一种印章提取及文字识别的方法及装置,该方法包括:通过霍夫圆检测确定待提取印章所在区域,并基于HSV颜色空间过滤法提取预定颜色印章;通过旋转框提取网络进行印章旋转文字提取得到印章旋转文字对应的旋转框;基于旋转框的最小外接矩形及深度学习模型对同一印章中不同旋转角度的文字进行矫正;通过模板匹配和OCR方法对矫正文字进行识别;将矫正文字与标准库中印章文字进行正则匹配,对矫正文字识别结果进行优化得到印章中旋转文字信息。通过该方案解决了印章提取及文字识别准确度不高的问题,可以保障印章提取速度及文字识别的准确度。
技术领域
本发明涉及人工智能领域,尤其涉及一种印章提取及文字识别的方法及装置。
背景技术
在企业的日常工作中,常常会涉及pdf等报件的审查工作,一般报件智能审查、判断pdf中是否有公章、以及提取公章和公章中文字信息对于日常的公章审查提取,可以显著减少人力投入,提高工作效率。
然而,传统基于深度学习的文字识别方法需要将印章中的旋转文字进行矫正才能识别,而印刷体粗体文字的识别,本身识别率不高,加上图章信息中文字覆盖、印章本身模糊等导致的信息失真,致使印章中旋转文字的识别准确率普遍较低。
发明内容
有鉴于此,本发明实施例提供了一种印章提取及文字识别方法及装置,以解决的现有印章文字识别准确率较低的问题。
在本发明实施例的第一方面,提供了一种印章提取及文字识别方法,包括:
通过霍夫圆检测确定待提取印章所在区域,并基于HSV颜色空间过滤法提取预定颜色印章;
通过旋转框提取网络进行印章旋转文字提取,得到印章旋转文字对应的旋转框;
基于旋转框的最小外接矩形及深度学习模型对同一印章中不同旋转角度的文字进行矫正;
通过模板匹配和OCR方法对矫正文字进行识别;
将矫正文字与标准库中印章文字进行正则匹配,对矫正文字识别结果进行优化得到印章中旋转文字信息。
在本发明实施例的第二方面,提供了一种用于印章提取及文字识别的装置,包括:
印章提取模块,用于通过霍夫圆检测确定待提取印章所在区域,并基于HSV颜色空间过滤法提取预定颜色印章;
旋转框提取模块,用于通过旋转框提取网络进行印章旋转文字提取,得到印章旋转文字对应的旋转框;
文字矫正模块,用于基于旋转框的最小外接矩形及深度学习模型对同一印章中不同旋转角度的文字进行矫正;
文字识别模块,用于通过模板匹配和OCR方法对矫正文字进行识别;
识别优化模块,用于将矫正文字与标准库中印章文字进行正则匹配,对矫正文字识别结果进行优化得到印章中旋转文字信息。
在本发明实施例的第三方面,提供了一种电子设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器运行的计算机程序,所述处理器执行所述计算机程序时实现如本发明实施例第一方面所述方法的步骤。
在本发明实施例的第四方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现本发明实施例第一方面提供的所述方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉光谷信息技术股份有限公司,未经武汉光谷信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011026136.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:钢结构加工用烘枪装置
- 下一篇:基于即时消息通信的设备纳管系统及方法