[发明专利]获取证件中信息的方法和装置、电子设备和存储介质在审
申请号: | 201910871447.9 | 申请日: | 2019-09-16 |
公开(公告)号: | CN110647832A | 公开(公告)日: | 2020-01-03 |
发明(设计)人: | 杨必韬 | 申请(专利权)人: | 贝壳技术有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32;G06K9/62;G06F16/2455;G06F16/29 |
代理公司: | 11657 北京思源智汇知识产权代理有限公司 | 代理人: | 毛丽琴 |
地址: | 300457 天津市滨海新区经济技术开发*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 证件 神经网络 文本信息 文字区域 证件图片 准确率 光学字符识别 修正 方法和装置 存储介质 地址信息 地址字段 电子设备 人力资源 文本识别 文字检测 业务需求 房屋 算法 | ||
1.一种获取证件中信息的方法,其特征在于,包括:
获取证件图片;
对所述证件图片进行文字检测,得到至少一个文字区域;
利用光学字符识别OCR算法,对所述至少一个文字区域进行文本识别,得到至少一项文本信息;
利用神经网络,对所述至少一项文本信息进行修正,得到所述证件的信息。
2.根据权利要求1所述的方法,其特征在于,所述证件包括以下任意一项或多项:房产证,身份证,驾驶证,护照。
3.根据权利要求1或2所述的方法,其特征在于,所述至少一项文本信息包括:地址信息;
所述利用神经网络,对所述至少一项文本信息进行修正,包括:利用神经网络,对所述至少一项文本信息中的地址信息进行修正。
4.根据权利要求1-3任一所述的方法,其特征在于,所述利用神经网络,对所述至少一项文本信息中的地址信息进行修正,包括:
基于预设规则对所述地址信息进行切分,得到多个待处理分段信息;
利用神经网络,分别将所述多个待处理分段信息中至少一个待处理分段信息中的各待处理分段信息与对应字段的信息数据库进行匹配,得到所述至少一个待处理分段信息的匹配结果;
以所述至少一个待处理分段信息的匹配结果相应代替所述多个待处理分段信息中的所述至少一个待处理分段信息,对得到的多个修正后分段信息进行拼接,得到修正后的地址信息。
5.根据权利要求4所述的方法,其特征在于,所述多个分段信息包括以下任意一项或多项:省市分段信息,行政区域分段信息,道路分段信息,楼宇地址分段信息。
6.根据权利要求5所述的方法,其特征在于,所述基于预设规则对所述地址信息进行切分,得到多个待处理分段信息,包括:
按照预设文字表述顺序读取所述地址信息;
响应于从所述地址信息读取到省市标识字段,将所述省市标识字段及之前的信息提取为省市分段信息;
响应于从待切分地址信息读取到行政区域标识字段,将所述行政区域标识字段及之前的信息提取为行政区域分段信息;其中,所述待切分地址信息包括:未读取到省市标识字段的所述地址信息,或者从所述地址信息抽取出所述省市分段信息后的其余地址信息;
按照所述预设文字表述顺序相反的顺序,读取从所述待切分地址信息提取出行政区域分段信息后的其余地址信息;
响应于从提取出行政区域分段信息后的其余地址信息中读取到楼宇地址标识字段,将所述楼宇地址标识字段及关联信息提取为楼宇地址分段信息;
将所述其余地址信息中所述行政区域分段信息与所述楼宇地址分段信息之间的信息作为道路分段信息。
7.根据权利要求5或6所述的方法,其特征在于,利用神经网络,分别将所述多个待处理分段信息中至少一个待处理分段信息中的各待处理分段信息与对应字段的信息数据库进行匹配,得到所述至少一个待处理分段信息的匹配结果,包括:
利用神经网络,分别将所述多个待处理分段信息中的省市分段信息、行政区域分段信息、道路分段信息、小区分段信息中的任意一项或多项,与对应字段的信息数据库进行匹配,以相似度最高的字段,作为对应待处理分段信息的匹配结果。
8.一种获取证件中信息的装置,其特征在于,包括:
获取模块,用于获取证件图片;
检测模块,用于对所述证件图片进行文字检测,得到至少一个文字区域;
识别模块,用于利用光学字符识别OCR算法,对所述至少一个文字区域进行文本识别,得到至少一项文本信息;
修正模块,用于利用神经网络,对所述至少一项文本信息进行修正,得到所述证件的信息。
9.一种电子设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述存储器中存储的计算机程序,且所述计算机程序被执行时,实现上述权利要求1-7任一所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时,实现上述权利要求1-7任一所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于贝壳技术有限公司,未经贝壳技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910871447.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种庭审巡查方法和系统
- 下一篇:一种垃圾分类判断装置及其方法