[发明专利]识别字符的方法、装置以及电子设备有效
申请号: | 202110950635.8 | 申请日: | 2021-08-18 |
公开(公告)号: | CN113743102B | 公开(公告)日: | 2023-09-01 |
发明(设计)人: | 张铭阳;蒋峰;张志达;胡晓雨;张国鹏;陈轶博;高丰;谢卓 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F40/279 | 分类号: | G06F40/279;G06F40/30;G06F40/242 |
代理公司: | 北京猷德知识产权代理有限公司 16084 | 代理人: | 范继晨 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 识别 字符 方法 装置 以及 电子设备 | ||
1.一种识别字符的方法,所述方法包括:
获取对待识别文本进行扫描后所得到的至少一个待识别字符;
显示对所述至少一个待识别字符进行字符纠错的初始识别结果;
响应对所述初始识别结果所包含的至少一个待识别字符的选择指令,从所述至少一个待识别字符中确定目标字符;
对所述目标字符进行识别,得到所述识别结果;
其中,所述方法还包括:
获取文本识别设备的文本扫描单元与所述待识别文本之间的距离,其中,所述文本识别设备至少包括所述文本扫描单元和文本显示单元,所述文本扫描单元至少用于采用多行扫描方式检测所述待识别文本,所述文本显示单元至少用于显示所述初始识别结果、所述目标字符、所述识别结果;
记录所述距离大于预设距离的第一时长;
在所述第一时长小于第一预设时长时,获取所述文本识别设备在所述第一时长之前所扫描到的第一字符,以及在所述第一时长之后所扫描到的第二字符;
对所述第一字符和所述第二字符进行接续处理,得到所述至少一个待识别字符;
在所述文本显示单元上显示所述至少一个待识别字符。
2.根据权利要求1所述的方法,获取对待识别文本进行扫描后所得到的至少一个待识别字符,包括:获取所述文本扫描单元对所述待识别文本进行扫描后所得到的至少一个待识别字符。
3.根据权利要求1所述的方法,对所述目标字符进行识别,得到所述识别结果,包括:
获取所述目标字符在所述待识别文本中的语义;
根据所述语义对所述目标字符进行识别,得到所述识别结果。
4.根据权利要求2所述的方法,其中,所述显示对所述至少一个待识别字符进行字符纠错的初始识别结果,包括:
在所述文本显示单元中显示对所述至少一个待识别字符进行自然语言处理所得到的初始识别结果。
5.根据权利要求2所述的方法,在获取对待识别文本进行扫描后所得到的至少一个待识别字符之前,所述方法还包括:
在所述文本扫描单元扫描异常时,在所述文本显示单元显示提示信息;
在所述提示信息的显示时长大于第二预设时长时,在所述文本显示单元对所述提示信息进行隐藏处理。
6.根据权利要求2所述的方法,在响应对所述初始识别结果所包含的至少一个待识别字符的选择指令,从所述至少一个待识别字符中确定目标字符之前,所述方法还包括:
检测所述至少一个待识别字符对应的字符类型;
响应对所述至少一个待识别字符的拆分指令,在所述文本显示单元显示根据所述字符类型对所述至少一个待识别字符进行拆分操作后的至少一个拆分字符。
7.根据权利要求6所述的方法,所述方法还包括:
根据如下任意一种或多种方式对所述至少一个待识别字符进行拆分操作;
基于预设词库所包含的字符对所述至少一个待识别字符进行拆分操作;
根据每个待识别字符所包含的单元数量对所述至少一个待识别字符进行拆分操作,其中,所述每个待识别字符由至少一个单元组成;
根据所述至少一个待识别字符的词频对所述至少一个待识别字符进行拆分操作。
8.根据权利要求2所述的方法,其中,所述对所述目标字符进行识别,得到所述识别结果,包括:
检测预设词库中是否存在所述目标字符对应的语义;
在所述预设词库中不存在所述目标字符对应的语义时,对所述目标字符进行增加字符操作和/或删除字符操作,得到第一目标字符;
在所述预设词库中查询所述第一目标字符所对应的语义,并在所述文本显示单元中显示所述第一目标字符所对应的语义。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110950635.8/1.html,转载请声明来源钻瓜专利网。