[发明专利]用于语音对话的纠正方法及系统有效
申请号: | 202010311357.7 | 申请日: | 2020-04-20 |
公开(公告)号: | CN111540356B | 公开(公告)日: | 2022-05-17 |
发明(设计)人: | 林永楷;樊帅 | 申请(专利权)人: | 思必驰科技股份有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/26;G06F40/30;G06F40/232 |
代理公司: | 北京商专永信知识产权代理事务所(普通合伙) 11400 | 代理人: | 黄谦;车江华 |
地址: | 215123 江苏省苏州市苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 语音 对话 纠正 方法 系统 | ||
本发明实施例提供一种用于语音对话的纠正方法。该方法包括:识别用户输入的对话语音的第一文本信息,其中,第一文本信息包括:由多个候选词确定的第一语义关键字;基于第一文本信息向用户反馈带有第一语义关键字的第一结果;响应于用户对第一结果内第一语义关键字的选择,将多个候选词向用户反馈;接收用户输入的第二语义关键字,基于第二语义关键字对第一文本信息进行纠正,确定纠正后的第二文本信息,基于第二文本信息向用户反馈带有第二语义关键字的第二结果。本发明实施例还提供一种用于语音对话的纠正系统。本发明实施例能够解决客观存在的真歧义问题,同时也提升了对话系统的对应错误的容忍与处理能力。
技术领域
本发明涉及智能语音领域,尤其涉及一种用于语音对话的纠正方法及系统。
背景技术
随着智能语音的发展,用户与智能设备的沟通更加便捷,智能设备对用户输入的语音进行语义理解以及识别,从而获取用户的意图,进而向用户反馈相应的操作。如果识别错误时,用户通常可以对其进行纠正,例如:
用户语音的识别结果:打电话给林永凯。
聊天机器人回复:为你找到林永凯的电话是否拔打。
用户语音的识别结果:是楷模的楷。
聊天机器人回复:为你找到林永楷的电话是否拔打。
又如:
用户语音的识别结果:导航去精英公寓。
聊天机器人回复:抱歉没有找到精英公寓。
用户语音的识别结果:是草字头的菁英。
聊天机器人回复:即将为您导航到菁英公寓。
又如:
用户语音的识别结果:我要去西藏。
聊天机器人回复:即将为您导航到西藏。
用户语音的识别结果:是站台的站。
聊天机器人回复:好的,即将为您导航到西站。
在实现本发明过程中,发明人发现相关技术中至少存在如下问题:
通过语音主动纠正上一轮或前几轮的说法,在使用纠正时通常需要描述清楚错误的文字,以及需要纠正后的文字,当文本比较长时,或者文本有重复时容易导致用户的表述比较困难。比如:
“我想买一张从北京西站去西藏的票”当出现识别错误时可能会变成,“我想买一张从北京新站去西站的票”,当用户想要纠正时需要说“不是北京新站是北京西站,而且也不是西站是西藏自治区的西藏”一则说法比较复杂,另外也可能无法处理纠正说法本身带来的识别错误,比如上句纠正的说法仍然可能会被误识别为“不是北京新站是北京西站,而且也不是新站是西藏自治区的西藏”。
或者是由于语言模型的原因,在上述对话中,即使用户再度重复n次“xi er qi”,也仍然会被识别成“西二奇”而不是“西二旗”。
受限于语音识别的本身的误识别,进行纠正时的说法识别结果也仍然是错误的。
进行语音纠正时,虽然用户发音正确,但是用户想要输入的词语刚好仍然不是置信度最高的那个词,仍然会被识别成其他词语。
在识别内容比较长时,容易出现多个发音相似的词语,又或者当多个语义槽识别的内容发音比较接近时,将导致不容易准确地确定需要进行纠正的词语的位置。
发明内容
为了至少解决现有技术中由于语言模型的原因,使得识别错误或识别出其他词语,对内容比较长的句子,或发音比较接近的句子,确定需要纠正词语的位置不容易确定的问题。
第一方面,本发明实施例提供一种用于语音对话的纠正方法,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于思必驰科技股份有限公司,未经思必驰科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010311357.7/2.html,转载请声明来源钻瓜专利网。