[发明专利]一种语音交互方法、装置、电子设备及存储介质在审
申请号: | 201911402606.7 | 申请日: | 2019-12-30 |
公开(公告)号: | CN113129896A | 公开(公告)日: | 2021-07-16 |
发明(设计)人: | 刘浩;耿磊 | 申请(专利权)人: | 北京猎户星空科技有限公司 |
主分类号: | G10L15/34 | 分类号: | G10L15/34;G10L15/08 |
代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 孟维娜;高莺然 |
地址: | 100041 北京市石景山区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 交互 方法 装置 电子设备 存储 介质 | ||
本发明实施例提供了一种语音交互方法、装置、电子设备及存储介质,涉及数据处理技术领域,包括:在检测到待识别语音开始后,请求与服务端建立连接;若第一预设时长内未成功与所述服务端建立连接,基于离线语音识别模型对采集到的待识别语音进行识别,得到离线识别结果并显示;所述第一预设时长后若与所述服务端成功建立连接,向所述服务端发送所述待识别语音,接收所述服务端发送的所述待识别语音的云端识别结果;在检测到待识别语音结束后,若满足更新要求,根据所接收的云端识别结果,更新显示的识别结果。应用本发明实施例提供的方案可以提高语音交互效率。
技术领域
本发明涉及数据处理技术领域,特别是涉及一种语音交互方法、装置、电子设备及存储介质。
背景技术
随着人工智能技术的飞速发展,各种智能设备的应用越来越广泛。为了便于用户使用,一些智能设备具有语音交互功能,这样用户可以通过语音与上述智能设备进行交互。上述智能设备在与用户进行语音交互的过程中,对用户的语音进行识别,并基于识别结果响应上述语音。
由于语音识别以及获得用于响应上述语音的响应信息需要消耗一定时间,为了防止用户认为智能设备未响应其语音,一般会显示识别结果。
例如,上述智能设备为商场中安放的具有导航功能的机器人时,机器人获得用户发出的“带我去会议室”的语音后,向服务端发送上述语音。服务端对接收到的语音进行识别,得到识别结果“带我去会议室”的文本,向机器人反馈上述识别结果,机器人显示文本“带我去会议室”。
虽然应用上述方式可以实现机器人与用户的交互,但是当网络较差时,机器人获得的语音不能及时被发送到服务端,服务端的识别结果也不能及时返回到机器人,进而机器人不能及时显示语音识别结果,导致交互效率低,给用户带来较差的体验。
发明内容
本发明实施例的目的在于提供一种语音交互方法、装置、电子设备及存储介质,以提高语音交互效率。具体技术方案如下:
第一方面,本发明实施例提供了一种语音交互方法,所述方法包括:
在检测到待识别语音开始后,请求与服务端建立连接;
若第一预设时长内未成功与所述服务端建立连接,基于离线语音识别模型对采集到的待识别语音进行识别,得到离线识别结果并显示;
所述第一预设时长后若与所述服务端成功建立连接,向所述服务端发送所述待识别语音,接收所述服务端发送的所述待识别语音的云端识别结果;
在检测到待识别语音结束后,若满足更新要求,根据所接收的云端识别结果,更新显示的识别结果。
本发明的一个实施例中,所述在检测到待识别语音结束后,若满足更新要求,根据所接收的云端识别结果,更新显示的识别结果,包括:
若检测到待识别语音结束后第二预设时长内接收到所述服务端返回的语音片段的云端识别结果,确定满足更新要求,根据接收到的所述语音片段的云端识别结果,更新显示的识别结果,其中,所述语音片段包括:检测到待识别语音的开始至检测到待识别语音的结束期间采集到的待识别语音。
本发明的一个实施例中,所述若检测到待识别语音结束后第二预设时长内接收到所述服务端返回的语音片段的云端识别结果,确定满足更新要求,根据接收到的所述语音片段的云端识别结果,更新显示的识别结果,包括:
若检测到待识别语音结束前已接收到过所述服务端返回的所述待识别语音的云端识别结果,且待识别语音结束后第二预设时长内接收到所述服务端返回的所述语音片段的云端识别结果,确定满足更新要求,根据接收到的云端识别结果,更新显示的识别结果。
本发明的一个实施例中,所述方法还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京猎户星空科技有限公司,未经北京猎户星空科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911402606.7/2.html,转载请声明来源钻瓜专利网。