[发明专利]证书图像文字的提取方法、装置及系统、计算机存储介质在审
申请号: | 201810104851.9 | 申请日: | 2018-02-02 |
公开(公告)号: | CN108171239A | 公开(公告)日: | 2018-06-15 |
发明(设计)人: | 李梓萁 | 申请(专利权)人: | 杭州清本科技有限公司 |
主分类号: | G06K9/34 | 分类号: | G06K9/34 |
代理公司: | 北京科石知识产权代理有限公司 11595 | 代理人: | 唐玉刚 |
地址: | 310012 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种证书图像文字的提取方法、装置及系统、计算机存储介质,其中,方法包括:根据证书图像确定证书类型;根据所述证书类型从远端服务器调取相同类型的参考证书文本信息;提取所述参考证书文本信息的字符格式;根据所述字符格式确定切分方式;利用所述切分方式切割所述证书图像得到字符图像和非字符图像。本发明可以有效切割证书图像中不同字体格式的字符,字符识别率及可靠性高。 1 | ||
搜索关键词: | 计算机存储介质 装置及系统 图像文字 文本信息 证书类型 字符格式 字符图像 切割 图像 远端服务器 图像确定 字符识别 字体格式 参考 调取 | ||
根据证书图像确定证书类型;
根据所述证书类型从远端服务器调取相同类型的参考证书文本信息;
提取所述参考证书文本信息的字符格式;
根据所述字符格式确定切分方式;以及
利用所述切分方式切割所述证书图像得到字符图像和非字符图像。
2.如权利要求1所述的证书图像文字的提取方法,其特征在于,利用所述切分方式切割所述证书图像的步骤之后,该方法还包括:识别所述字符图像得到可编辑数字证书文本信息。
3.如权利要求2所述的证书图像文字的提取方法,其特征在于,识别所述字符图像得到可编辑数字证书文本信息的步骤之后,该方法还包括:利用所述字符格式编辑所述可编辑数字证书文本信息;以及
根据所述非字符图像和编辑后的所述可编辑数字证书文本信息恢复含有所述可编辑数字证书文本信息的所述证书图像。
4.如权利要求1所述的证书图像文字的提取方法,其特征在于,根据证书图像确定证书类型的步骤,具体包括:提取所述证书图像的主要特征;以及
根据所述主要特征确定所述证书类型。
5.一种证书图像文字的提取装置,其特征在于,该装置包括:第一确定单元,用于根据证书图像确定证书类型;
调取单元,用于根据所述证书类型从远端服务器调取相同类型的参考证书文本信息;
提取单元,用于提取所述参考证书文本信息的字符格式;
第二确定单元,用于根据所述字符格式确定切分方式;以及
分割单元,用于利用所述切分方式切割所述证书图像得到字符图像和非字符图像。
6.如权利要求5所述的证书图像文字的提取装置,其特征在于,该装置还包括:识别单元,用于识别所述字符图像得到可编辑数字证书文本信息。
7.如权利要求6所述的证书图像文字的提取装置,其特征在于,该装置还包括:编辑单元,用于利用所述字符格式编辑所述可编辑数字证书文本信息;以及
恢复单元,用于根据所述非字符图像和编辑后的所述可编辑数字证书文本信息恢复含有所述可编辑数字证书文本信息的所述证书图像。
8.如权利要求5所述的证书图像文字的提取装置,其特征在于,所述第一确定单元具体包括:提取模块,用于提取所述证书图像的主要特征;以及
确定模块,用于根据所述主要特征确定所述证书类型。
9.一种证书图像文字的提取系统,其特征在于,该系统包括:多个如权利要求5~8任一所述的提取装置,以及与所述提取装置连接的远端服务器,其中,所述提取装置用于根据所述证书图像确定证书类型;
所述远端服务器用于根据所述证书图像的所述证书类型向所述提供装置提供的参考证书文本信息;
所述提取装置还用于提取所述参考证书文本信息的字符格式,并根据所述字符格式确定切分方式,以便利用所述切分方式切割所述证书图像。
10.一种包含计算机执行指令的计算机存储介质,所述计算机执行指令经由数据处理设备处理时,该数据处理设备执行权利要求1~4任一所述的证书图像文字的提取方法。该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州清本科技有限公司,未经杭州清本科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810104851.9/,转载请声明来源钻瓜专利网。