[发明专利]字符识别方法、装置、设备及存储介质在审
申请号: | 201811254944.6 | 申请日: | 2018-10-25 |
公开(公告)号: | CN109657738A | 公开(公告)日: | 2019-04-19 |
发明(设计)人: | 周罡;王彬 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06K9/68 | 分类号: | G06K9/68 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 胡海国 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 预设 模糊匹配算法 参考 存储介质 目标字符 文字识别 预设区域 字符识别 分词 筛选 异常字符 数据处理 预存 调用 文本 查找 | ||
1.一种字符识别方法,其特征在于,所述字符识别方法包括:
获取待识别文本;
调用第一预设区域中预存的分词工具,通过所述分词工具将所述待识别文本划分为多个预设长度的参考字符;
获取所述分词工具划分后的参考字符,根据所述参考字符的目标长度在第二预设区域查找对应的预设词典,并判断所述预设词典中是否存有所述参考字符;
在所述预设词典中未存有所述参考字符时,通过模糊匹配算法对未存有的参考字符进行筛选,得到目标字符,并将所述目标字符进行展示。
2.如权利要求1所述的字符识别方法,其特征在于,所述调用第一预设区域中预存的分词工具,通过所述分词工具将所述待识别文本划分为多个预设长度的参考字符之前,所述方法包括:
接收工具写入指令,提取所述工具写入指令中的分词工具和分词写入地址信息,根据所述分词写入地址信息将所述分词工具写入所述第一预设区域并进行保存。
3.如权利要求1所述的字符识别方法,其特征在于,所述调用第一预设区域中预存的分词工具,通过所述分词工具将所述待识别文本划分为多个预设长度的参考字符,包括:
调用第一预设区域中预存的分词工具,通过所述分词工具将所述待识别文本与各个预设长度的关键词进行比较,根据比较结果提取所述待识别文本中的各个预设长度的目标关键词,将所述目标关键词作为所述预设长度的参考字符。
4.如权利要求1至3中任一项所述的字符识别方法,其特征在于,所述获取所述分词工具划分后的参考字符,根据所述参考字符的目标长度在第二预设区域查找对应的预设词典,并判断所述预设词典中是否存有所述参考字符之前,所述方法还包括:
接收字典写入指令,提取所述字典写入指令中的预设字典和字典写入地址信息,根据所述字典写入地址信息将所述预设字典写入所述第二预设区域。
5.如权利要求1至3中任一项所述的字符识别方法,其特征在于,所述获取所述分词工具划分后的参考字符,根据所述参考字符的目标长度在第二预设区域查找对应的预设词典,并判断所述预设词典中是否存有所述参考字符,包括:
获取所述分词工具划分后的参考字符,根据所述参考字符的目标长度在预设地址关系映射表中查找对应的存储地址;
根据所述存储地址在预设区域查找对应的预设词典,并提取所述参考字符的特征信息,将所述特征信息与查找到的词典中的字符的特征信息进行比较,根据比较结果判断所述词典中是否存有所述参考字符。
6.如权利要求1至3中任一项所述的字符识别方法,其特征在于,所述在所述预设词典中未存有所述参考字符时,通过模糊匹配算法对未存有的参考字符进行筛选,得到目标字符,并将所述目标字符进行展示,包括:
在所述预设词典中未存有所述参考字符时,通过所述模糊匹配算法在所述预设词典中查找出编辑距离小于所述参数字符对应的目标长度的目标字符,将所述目标字符进行展示。
7.如权利要求6所述的字符识别方法,其特征在于,所述获取待识别文本之后,所述方法还包括:
将待识别文本中的各个初始识别字符建立初始识别列表;
所述在所述预设词典中未存有所述参考字符时,通过所述模糊匹配算法在所述预设词典中查找出编辑距离小于所述参数字符对应的目标长度的目标字符,将所述目标字符进行展示,包括:
在所述预设词典中未存有所述参考字符时,通过所述模糊匹配算法在所述预设词典中查找出编辑距离小于所述参数字符对应的目标长度的目标字符;
判断所述目标字符的数量,在所述数量为多个时,判断所述目标字符是否存在所述初始识别列表中,将存在所述初始识别列表中的字符对应的目标字符进行展示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811254944.6/1.html,转载请声明来源钻瓜专利网。