[发明专利]一种语音交互方法、装置、设备和计算机存储介质有效
申请号: | 202011307586.8 | 申请日: | 2020-11-20 |
公开(公告)号: | CN112382290B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 黄际洲;丁世强 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/30 |
代理公司: | 北京鸿德海业知识产权代理有限公司 11412 | 代理人: | 田宏宾 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 交互 方法 装置 设备 计算机 存储 介质 | ||
本申请公开了一种语音交互方法、装置、设备和计算机存储介质,涉及人工智能和语音技术领域。具体实现方案为:对用户输入的语音指令进行语音识别和需求解析;响应于解析得到的未知需求,利用所述需求解析的结果获取问询实体信息和问询内容,并通过与所述问询实体进行通信获取所述问询内容对应的答复信息;利用所述答复信息向所述用户返回第一语音应答。本申请能够弥补语音助手原本需求满足方面的盲区,尽可能问询到用户的新需求,提升用户体验。
技术领域
本申请涉及计算机应用技术领域,特别涉及人工智能和语音技术领域。
背景技术
本部分旨在为权利要求书中陈述的本发明的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就被认为是现有技术。
随着语音交互技术的不断发展,用户能够与智能音箱、智能手机等终端设备进行语音交互。除了终端设备操作系统自带的语音助手之外,越来越多的应用搭载了语音交互技术。用户能够通过输入语音指令获取对应的服务,从而在很大程度上解放双手。
现有语音交互场景中,由于用户需求是无法事先枚举完的,在对用户输入的语音指令进行语音识别和需求理解后,常常面临语音助手无法解决用户新需求的情况,只能向用户返回诸如“对不起,我还不知道这个信息”的应答。这种应答方式会给用户带来较差的体验,无法满足用户的需求。
发明内容
有鉴于此,本申请提供了一种语音交互方法、装置、设备以及存储介质,以满足用户新需求,提高用户体验。
根据第一方面,提供了一种语音交互方法,包括:
对用户输入的语音指令进行语音识别和需求解析;
响应于解析得到的未知需求,利用所述需求解析的结果获取问询实体信息和问询内容,并通过与所述问询实体进行通信获取所述问询内容对应的答复信息;
利用所述答复信息向所述用户返回第一语音应答。
根据第二方面,提供了一种语音交互装置,包括:
语音处理单元,用于对用户输入的语音指令进行语音识别和需求解析;
对话决策单元,用于响应于所述语音处理单元解析得到的未知需求,利用所述需求解析的结果获取问询实体信息和问询内容;
自动问询单元,用于通过与所述问询实体进行通信获取所述问询内容对应的答复信息;
语音交互单元,用于利用所述答复信息向所述用户返回第一语音应答。
根据第三方面,提供了一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述的方法。
根据第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行上述的方法。
第五方面,本申请还提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据上述任一项所述的方法。
由以上技术方案可以看出,本申请在解析得到用户的新需求的情况下,不是简单地向用户回复无法解决新需求的语音应答,而是通过与问询实体进行通讯来获取问询内容对应的答复信息,并利用答复信息向用户返回语音应答。这种方式能够弥补语音助手原本需求满足方面的盲区,尽可能问询到用户的新需求,提升用户体验。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011307586.8/2.html,转载请声明来源钻瓜专利网。