[发明专利]基于文字识别的材料审核方法及设备有效
申请号: | 201910406503.1 | 申请日: | 2019-05-16 |
公开(公告)号: | CN110197140B | 公开(公告)日: | 2023-05-26 |
发明(设计)人: | 何政;叶刚;王萍 | 申请(专利权)人: | 武汉邦拓信息科技有限公司 |
主分类号: | G06V30/413 | 分类号: | G06V30/413;G06V30/19 |
代理公司: | 武汉智嘉联合知识产权代理事务所(普通合伙) 42231 | 代理人: | 黄君军 |
地址: | 430070 湖北省武汉市东湖新技术*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 文字 识别 材料 审核 方法 设备 | ||
1.一种基于文字识别的材料审核方法,其特征在于,包括:
调用文字识别引擎,对已分类图片进行文字识别,得到文字识别后的已分类图片,对所述文字识别后的已分类图片中的文字,进行文字聚类,得到最终识别用图片;
对所述最终识别用图片进行文字比对,将比对结果发送至审核端,若所述比对结果一致,则材料审核通过;
其中,所述已分类图片为所述材料经过扫描后得到的图片;
所述对所述文字识别后的已分类图片中的文字,进行文字聚类,得到最终识别用图片,包括:
从所述文字识别后的已分类图片中,提取若干关联文字,将所述若干关联文字组合成字符串,根据所述字符串,对所述文字识别后的已分类图片进行匹配,得到最终识别用图片;
所述对所述最终识别用图片进行文字比对,包括:
将输入文字与所述最终识别用图片中的文字进行比对,若所述输入文字与所述最终识别用图片中的文字,相同率大于判断阈值,则判定为比对结果一致;
所述将输入文字与所述最终识别用图片中的文字进行比对,包括:
定义若干易混淆字符集,将所述输入文字中的一字符,与所述最终识别用图片中的文字中的另一字符进行比对,若所述一字符与所述另一字符属于同一易混淆字符集,则判定所述一字符与所述另一字符相同。
2.根据权利要求1所述的基于文字识别的材料审核方法,其特征在于,还包括:
若所述比对结果不一致,则在审核端上对不一致的文字进行标记,根据所述标记进行后续审核。
3.一种基于文字识别的材料审核装置,其特征在于,包括:
图片分类模块,用于调用文字识别引擎,对已分类图片进行文字识别,得到文字识别后的已分类图片,对所述文字识别后的已分类图片中的文字,进行文字聚类,得到最终识别用图片;
文字比对模块,用于对所述最终识别用图片进行文字比对,将比对结果发送至审核端,若所述比对结果一致,则材料审核通过;
其中,所述已分类图片为所述材料经过扫描后得到的图片;
所述对所述文字识别后的已分类图片中的文字,进行文字聚类,得到最终识别用图片,包括:
从所述文字识别后的已分类图片中,提取若干关联文字,将所述若干关联文字组合成字符串,根据所述字符串,对所述文字识别后的已分类图片进行匹配,得到最终识别用图片;
所述对所述最终识别用图片进行文字比对,包括:
将输入文字与所述最终识别用图片中的文字进行比对,若所述输入文字与所述最终识别用图片中的文字,相同率大于判断阈值,则判定为比对结果一致;
所述将输入文字与所述最终识别用图片中的文字进行比对,包括:
定义若干易混淆字符集,将所述输入文字中的一字符,与所述最终识别用图片中的文字中的另一字符进行比对,若所述一字符与所述另一字符属于同一易混淆字符集,则判定所述一字符与所述另一字符相同。
4.一种电子设备,其特征在于,包括:
至少一个处理器、至少一个存储器、通信接口和总线;其中,
所述处理器、存储器、通信接口通过所述总线完成相互间的通信;
所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令,以执行如权利要求1至2任一项所述的方法。
5.一种非暂态计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行如权利要求1至2中任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉邦拓信息科技有限公司,未经武汉邦拓信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910406503.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种车辆牌照的检测识别方法
- 下一篇:一种提取蚯蚓活动轨迹坐标序列的方法