[发明专利]一种信息识别方法、装置和终端设备有效
申请号: | 201710054957.8 | 申请日: | 2017-01-24 |
公开(公告)号: | CN108345581B | 公开(公告)日: | 2022-10-14 |
发明(设计)人: | 邸楠 | 申请(专利权)人: | 北京搜狗科技发展有限公司 |
主分类号: | G06F40/284 | 分类号: | G06F40/284;G06F40/232;G06F40/274 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 苏培华 |
地址: | 100084 北京市海淀区中关*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 信息 识别 方法 装置 终端设备 | ||
本申请实施例提供了一种信息识别方法、装置和终端设备,以减少信息识别错误。所述的方法包括:获取至少两个识别结果,其中,不同识别结果依据不同识别方式识别得到,不同识别结果对应识别的输入信息来源于同一信息内容;将所述至少两个识别结果进行比较,得到相应的纠错位置及对应的待纠错字符,其中,识别结果中纠错位置对应的字符为待纠错字符;对所述各识别结果中每个纠错位置对应的待纠错字符分别进行纠错,得到纠错后的识别内容。对所述各纠错位置对应的待纠错字符分别进行纠错,能够有效的提高识别的准确性。
技术领域
本申请涉及通信技术领域,特别是涉及一种信息识别方法、一种信息识别装置和一种终端设备。
背景技术
随着科技的发展,人机交互是指人与计算机之间使用某种对话语言,以一定的交互方式,为完成确定任务的信息交换过程。
在人机交互过程中,机器获取信息的方式有多种,如语音、图像、文本等。但是,每种方式在进行识别时均可能存在一定的误差导致出现识别错误的问题,例如语音识别输入过程中将“一衣带水”识别成“一一带水”,图像识别中将“滕王阁”识别成“滕王阎”、将“阈值”识别成“阀值”等,该识别导致的识别错误会导致后续交互过程中出现问题。
发明内容
本申请实施例所要解决的技术问题是提供一种信息识别方法,以减少识别错误。
相应的,本申请实施例还提供了一种信息识别装置和一种终端设备,用以保证上述方法的实现及应用。
为了解决上述问题,本申请实施例公开了一种信息识别方法,包括:获取至少两个识别结果,其中,不同识别结果依据不同识别方式识别得到,不同识别结果对应识别的输入信息来源于同一信息内容;将所述至少两个识别结果进行比较,得到相应的纠错位置及对应的待纠错字符,其中,识别结果中纠错位置对应的字符为待纠错字符;对所述各识别结果中每个纠错位置对应的待纠错字符分别进行纠错,得到纠错后的识别内容。
可选的,所述将所述至少两个识别结果进行比较,得到相应的纠错位置及对应的待纠错字符,包括:将各识别结果中包括的字符进行顺序比对,得到公共字符序列,所述公共字符序列包括顺序排列的至少一个公共字符,所述公共字符为各识别结果中按照一定顺序的相同字符;依据所述公共字符序列在各识别结果中确定纠错位置,查询得到各识别结果中所述纠错位置对应的待纠错字符。
可选的,所述将各识别结果中包括的字符进行顺序比对,得到公共字符序列,包括:将各识别结果中包括的字符进行顺序比对,得到不同识别结果中的相同字符,作为公共字符;依据比对顺序,将所述公共字符排列构成公共字符序列。
可选的,所述依据所述公共字符序列在各识别结果中确定纠错位置,包括:依据所述公共字符序列将至少两个识别结果以字符为单位对齐,将各识别结果中对齐位置相同但字符不同的对齐位置确定为纠错位置。
可选的,依据所述公共字符序列将至少两个识别结果以字符为单位对齐之后,所述将各识别结果中对齐位置相同但字符不同的对齐位置确定为纠错位置之前,还包括:当不同识别结果对应两个公共字符之间的字符数量不同时,对所述两个公共字符间的字符数量多的识别结果中、所述两个公共字符间包括的字符进行过滤。
可选的,所述对所述各识别结果中每个纠错位置对应的待纠错字符分别进行纠错,得到纠错后的识别内容,包括:依据各识别结果中每个纠错位置对应的待纠错字符确定所述纠错位置对应的字符集,从所述字符集中匹配得到修正字符;将各识别结果中所述纠错位置的字符替换为所述修正字符,得到纠错后的识别内容。
可选的,所述依据各识别结果中每个纠错位置对应的待纠错字符确定所述纠错位置对应的字符集,从所述字符集中匹配得到修正字符,包括:针对每个所述纠错位置,依据每个识别结果中所述纠错位置对应的待纠错字符和每个识别结果对应的识别方式,匹配至少一个待选字符,生成对应的字符集;将所述字符集中的待选字符按照至少一个维度进行匹配,依据匹配结果选择待选字符为修正字符。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狗科技发展有限公司,未经北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710054957.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种词向量处理方法及装置
- 下一篇:一种识别社交群从事业务的方法及装置
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置