[发明专利]证书图像文字的提取方法、装置及系统、计算机存储介质在审

专利信息
申请号: 201810104851.9 申请日: 2018-02-02
公开(公告)号: CN108171239A 公开(公告)日: 2018-06-15
发明(设计)人: 李梓萁 申请(专利权)人: 杭州清本科技有限公司
主分类号: G06K9/34 分类号: G06K9/34
代理公司: 北京科石知识产权代理有限公司 11595 代理人: 唐玉刚
地址: 310012 浙江*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 计算机存储介质 装置及系统 图像文字 文本信息 证书类型 字符格式 字符图像 切割 图像 远端服务器 图像确定 字符识别 字体格式 参考 调取
【说明书】:

发明提供一种证书图像文字的提取方法、装置及系统、计算机存储介质,其中,方法包括:根据证书图像确定证书类型;根据所述证书类型从远端服务器调取相同类型的参考证书文本信息;提取所述参考证书文本信息的字符格式;根据所述字符格式确定切分方式;利用所述切分方式切割所述证书图像得到字符图像和非字符图像。本发明可以有效切割证书图像中不同字体格式的字符,字符识别率及可靠性高。

技术领域

本发明涉及图像处理技术领域,尤其涉及一种提取证书图像中文字的方法,具体来说就是一种证书图像文字的提取方法、装置及系统、计算机存储介质。

背景技术

随着人们对计算机技术及网络通信的日益依赖,需要将大量的纸质资料录入计算机,例如,动产及不动产买卖、租赁过程中,对证件、材料、资质证明进行扫描,对历史文献、书籍进行电子化处理。为了更好地保存、检索、查看文字类纸质材料,人们又研发出文字识别技术,自动识别、提取图片或照片中的文字信息。

所谓的文字识别就是利用计算机自动识别字符的技术,是模式识别应用的一个重要领域。具体就是利用大量的字符样本,经过复杂的神经网络学习,生成相应的模型文件,从而达到识别图片或照片中字符的目的。其中,OCR(optical character recognition)文字识别是文字识别技术的代表。OCR技术主要识别拍摄、扫描图片中的字符,首先需要将图像中的字符串切分开,形成包含单个文字的小图片,然后对切分后的文字进行识别。现有文字切分进了常用的方法为投影法,即是将图像文字二值化处理后,通过垂直投影法找到两个文字之间的分界线,根据分界线将文字切分开来。

然而,对于毕业证、营业执照等证书来说,扫描或拍摄的证书图像中的字符之间的差别很大,例如,证书图像中字符的字体、字符大小、字符色泽差别很大,而且证书图像中的字符之间具有粘连,现有投影方法很难较好地切分证书图像中的字符,同时切分质量的好坏直接影响到OCR文字识别效果,最终导致无法从证书图像中提取正确的文字信息。

因此,本领域技术人员亟需研发一种有效切割证书图像中字符的方法,提高OCR文字识别的正确率。

发明内容

有鉴于此,本发明要解决的技术问题在于提供一种证书图像文字的提取方法、装置及系统、计算机存储介质,解决了现有图像文字切割方式无法适应于证书图像文字切分,导致OCR技术无法正确识别证书图像中字符的问题。

为了解决上述技术问题,本发明的具体实施方式提供一种证书图像文字的提取方法,包括:根据证书图像确定证书类型;根据所述证书类型从远端服务器调取相同类型的参考证书文本信息;提取所述参考证书文本信息的字符格式;根据所述字符格式确定切分方式;利用所述切分方式切割所述证书图像得到字符图像和非字符图像。

本发明的具体实施方式还提供一种证书图像文字的提取装置,包括:第一确定单元,用于根据证书图像确定证书类型;调取单元,用于根据所述证书类型从远端服务器调取相同类型的参考证书文本信息;提取单元,用于提取所述参考证书文本信息的字符格式;第二确定单元,用于根据所述字符格式确定切分方式;分割单元,用于利用所述切分方式切割所述证书图像得到字符图像和非字符图像。

本发明的具体实施方式还提供一种证书图像文字的提取系统,包括:多个提取装置,以及与所述提取装置连接的远端服务器。其中,所述提取装置用于根据所述证书图像确定证书类型;所述远端服务器用于根据所述证书图像的所述证书类型向所述提供装置提供的参考证书文本信息;所述提取装置还用于提取所述参考证书文本信息的字符格式,并根据所述字符格式确定切分方式,以便利用所述切分方式切割所述证书图像。

本发明的具体实施方式还提供一种包含计算机执行指令的计算机存储介质,所述计算机执行指令经由数据处理设备处理时,该数据处理设备执行证书图像文字的提取方法。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州清本科技有限公司,未经杭州清本科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810104851.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top