[发明专利]用于语音对话的纠正方法及系统有效

申请号：	202010311357.7	申请日：	2020-04-20
公开（公告）号：	CN111540356B	公开（公告）日：	2022-05-17
发明（设计）人：	林永楷;樊帅	申请（专利权）人：	思必驰科技股份有限公司
主分类号：	G10L15/22	分类号：	G10L15/22;G10L15/26;G06F40/30;G06F40/232
代理公司：	北京商专永信知识产权代理事务所(普通合伙) 11400	代理人：	黄谦;车江华
地址：	215123 江苏省苏州市苏***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	用于语音对话纠正方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明实施例提供一种用于语音对话的纠正方法。该方法包括：识别用户输入的对话语音的第一文本信息，其中，第一文本信息包括：由多个候选词确定的第一语义关键字；基于第一文本信息向用户反馈带有第一语义关键字的第一结果；响应于用户对第一结果内第一语义关键字的选择，将多个候选词向用户反馈；接收用户输入的第二语义关键字，基于第二语义关键字对第一文本信息进行纠正，确定纠正后的第二文本信息，基于第二文本信息向用户反馈带有第二语义关键字的第二结果。本发明实施例还提供一种用于语音对话的纠正系统。本发明实施例能够解决客观存在的真歧义问题，同时也提升了对话系统的对应错误的容忍与处理能力。

技术领域

本发明涉及智能语音领域，尤其涉及一种用于语音对话的纠正方法及系统。

背景技术

随着智能语音的发展，用户与智能设备的沟通更加便捷，智能设备对用户输入的语音进行语义理解以及识别，从而获取用户的意图，进而向用户反馈相应的操作。如果识别错误时，用户通常可以对其进行纠正，例如：

用户语音的识别结果：打电话给林永凯。

聊天机器人回复：为你找到林永凯的电话是否拔打。

用户语音的识别结果：是楷模的楷。

聊天机器人回复：为你找到林永楷的电话是否拔打。

又如：

用户语音的识别结果：导航去精英公寓。

聊天机器人回复：抱歉没有找到精英公寓。

用户语音的识别结果：是草字头的菁英。

聊天机器人回复：即将为您导航到菁英公寓。

又如：

用户语音的识别结果：我要去西藏。

聊天机器人回复：即将为您导航到西藏。

用户语音的识别结果：是站台的站。

聊天机器人回复：好的，即将为您导航到西站。

在实现本发明过程中，发明人发现相关技术中至少存在如下问题：

通过语音主动纠正上一轮或前几轮的说法，在使用纠正时通常需要描述清楚错误的文字，以及需要纠正后的文字,当文本比较长时，或者文本有重复时容易导致用户的表述比较困难。比如：

“我想买一张从北京西站去西藏的票”当出现识别错误时可能会变成，“我想买一张从北京新站去西站的票”，当用户想要纠正时需要说“不是北京新站是北京西站，而且也不是西站是西藏自治区的西藏”一则说法比较复杂,另外也可能无法处理纠正说法本身带来的识别错误,比如上句纠正的说法仍然可能会被误识别为“不是北京新站是北京西站,而且也不是新站是西藏自治区的西藏”。

或者是由于语言模型的原因，在上述对话中，即使用户再度重复n次“xi er qi”，也仍然会被识别成“西二奇”而不是“西二旗”。

受限于语音识别的本身的误识别,进行纠正时的说法识别结果也仍然是错误的。

进行语音纠正时，虽然用户发音正确,但是用户想要输入的词语刚好仍然不是置信度最高的那个词，仍然会被识别成其他词语。

在识别内容比较长时，容易出现多个发音相似的词语，又或者当多个语义槽识别的内容发音比较接近时，将导致不容易准确地确定需要进行纠正的词语的位置。

发明内容

为了至少解决现有技术中由于语言模型的原因，使得识别错误或识别出其他词语，对内容比较长的句子，或发音比较接近的句子，确定需要纠正词语的位置不容易确定的问题。

第一方面，本发明实施例提供一种用于语音对话的纠正方法，包括：

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于思必驰科技股份有限公司，未经思必驰科技股份有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202010311357.7/2.html，转载请声明来源钻瓜专利网。