[发明专利]印章文字识别方法、装置、计算机设备和存储介质有效
申请号: | 202110375519.8 | 申请日: | 2021-04-08 |
公开(公告)号: | CN112766275B | 公开(公告)日: | 2021-09-10 |
发明(设计)人: | 许康;宁可;蒋菲;罗春桉 | 申请(专利权)人: | 金蝶软件(中国)有限公司 |
主分类号: | G06K9/34 | 分类号: | G06K9/34;G06K9/32;G06K9/46;G06K9/62 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 李文渊 |
地址: | 518000 广东省深圳市南山区*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 印章 文字 识别 方法 装置 计算机 设备 存储 介质 | ||
本申请涉及一种印章文字识别方法、装置、计算机设备和存储介质。所述方法包括:检测目标图像中的印章图像,并从所述目标图像中截取出所述印章图像;对所述印章图像进行背景消除,得到背景消除印章图像;在所述背景消除印章图像中定位环形排版文字图像;对所述环形排版文字图像进行拉直处理,得到直条排版文字图像;对所述直条排版文字图像进行文字识别,获得印章文字。采用本方法能够提高印章文字识别的准确率。
技术领域
本申请涉及计算机技术领域,特别是涉及一种印章文字识别方法、装置、计算机设备和存储介质。
背景技术
随着计算机技术的发展,通过机器检测并识别图像中的目标对象的技术,得到了广泛的使用。目前,通过机器检测并识别图像中的印章,通常是通过预留的印章图像去匹配出图像中的印章,对匹配出的印章的文字区域进行分割,对分割后的文字区域进行文字识别,以识别出印章的文字。
然而,通过预留的印章图像去匹配出图像中的印章,若是图像中的印章出现了改变,那么就无法和预留的印章图像进行匹配。而且,直接对分割后的印章的文字区域进行文字识别,若是因拍摄角度问题造成印章文字区域的文字形变而分割不准确或是有背景干扰在印章文字区域上,则会导致文字识别有误。因此,目前的印章文字识别方法的准确率不高。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高准确率的印章文字识别方法、装置、计算机设备和存储介质。
一种印章文字识别方法,所述方法包括:
检测目标图像中的印章图像,并从所述目标图像中截取出所述印章图像;
对所述印章图像进行背景消除,得到背景消除印章图像;
在所述背景消除印章图像中定位环形排版文字图像;
对所述环形排版文字图像进行拉直处理,得到直条排版文字图像;
对所述直条排版文字图像进行文字识别,获得印章文字。
在其中一个实施例中,所述印章图像是通过印章检测模型检测到的;所述印章检测模型是通过印章检测模型训练步骤训练得到的,所述印章检测模型训练步骤包括:
获取样本图像以及标注所述样本图像中印章位置的样本印章位置数据;
将所述样本图像调整至预设尺寸,将调整后的样本图像输入至待训练的印章检测模型,得到至少一个中间预测位置数据;
基于所述中间预测位置数据和所述样本印章位置数据的差异,调整所述印章检测模型的参数,使得所述印章检测模型预测的中间预测位置数据朝所述样本印章位置数据收敛,并继续训练,直至满足第一训练停止条件时停止训练,获得经过训练的印章检测模型。
在其中一个实施例中,所述背景消除印章图像是通过印章背景消除模型生成的;所述印章背景消除模型是通过印章背景消除模型训练步骤训练得到的,所述印章背景消除模型训练步骤包括:
获取样本印章图像以及模板图像,所述模板图像标记有所述样本印章图像中的文字区域和非文字区域;
根据所述模板图像,调整待训练的印章背景消除模型的参数,使得所述印章背景消除模型针对所述样本印章图像的文字区域消除背景,得到中间背景消除印章图像;
基于所述中间背景消除印章图像与所述样本印章图像对应的背景消除标注图像之间的像素点差异,调整所述印章背景消除模型的参数,使得所述像素点差异朝预期差异范围收敛,并继续训练,直至满足第二训练停止条件时停止训练,获得经过训练的印章背景消除模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于金蝶软件(中国)有限公司,未经金蝶软件(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110375519.8/2.html,转载请声明来源钻瓜专利网。