[发明专利]语音对话方法及装置在审
申请号: | 201811444913.7 | 申请日: | 2018-11-29 |
公开(公告)号: | CN109361765A | 公开(公告)日: | 2019-02-19 |
发明(设计)人: | 吴旺;张顺 | 申请(专利权)人: | 苏州思必驰信息科技有限公司 |
主分类号: | H04L29/08 | 分类号: | H04L29/08 |
代理公司: | 北京商专永信知识产权代理事务所(普通合伙) 11400 | 代理人: | 方挺;车江华 |
地址: | 215123 江苏省苏州市苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标应用 用户语音 响应 网站应用程序 过渡信息 应答结果 语音对话 推送 应用服务响应 服务响应 获取目标 接口调用 接口接收 静默状态 时间等待 时间确定 用户等待 用户体验 阈值时 返回 应答 服务 焦虑 | ||
本发明公开一种语音对话方法及装置,其中方法包括:根据用户语音请求确定能够响应用户语音请求的目标应用服务;获取目标应用服务响应用户语音请求的平均响应时间,平均响应时间基于目标应用服务响应用户语音请求的历史响应时间确定;当平均响应时间大于第一设定阈值时,通过网站应用程序接口调用所述目标应用服务,并向用户推送等待过渡信息;通过所述网站应用程序接口接收所述目标应用服务所返回的应答结果,并呈现给用户。通过在确定响应用户语音请求所需要的时间超过一定的时间的时候,在目标应用服务返回应答结果之前,向用户推送等待过渡信息,从而能够避免用户在静默状态下长时间等待应答,避免用户等待焦虑,改善了用户体验。
技术领域
本发明涉及人工智能技术领域,尤其涉及一种语音对话方法及装置。
背景技术
从用户与对话系统交互的角度看,多轮对话可以分为语义槽填充阶段和意图实现阶段。以一个用户订机票的人机对话场景为例来解释和说明语义槽填充阶段和意图实现阶段的区别:
user1:请帮我订一张去北京的机票。
system1:请问你要从哪里出发?
user2:上海。
system2:请问你哪天出发?
user3:明天。
system3:为你找到10个11月4日从上海到北京的航班信息,请问你要选择哪一个?
user4:第三个。
system4:好的,为你跳转至订票页面。
其中,对话交互过程user1到user3属于语义槽填充阶段,system3到system4是意图实现阶段。语义槽填充阶段负责收集保证对话进行下去的必要信息,意图实现阶段通过查询web API(网站应用程序接口)或者函数计算(FAAS),来获取应用数据。
在意图实现阶段的那一轮对话中,系统生成的对话回复,依赖应用数据查询结果,用户在user3阶段说完话后,到听到system3的回复结果这段延迟时间包含了对话系统内部做web API查询的耗时时间。
对话系统和web API的服务提供者常常是不同公司,研发对话系统的公司通常是以人工智能技术为主要业务的公司,以web API形式提供应用数据查询的公司往往是CP(服务内容提供商),SP(服务提供商)公司,所以当web API查询时间长时,在用户端的感觉就是对话回复慢,即user3到system3之间的时间差大。
在云端对话的意图实现阶段,通常需要以web API的方式获取外部CP或SP平台的应用数据,这部分耗时会最终体现在用户等待对话系统的回复上。如果CP或SP提供的查询接口延时高,会造成用户在对话交互中感觉对话回复慢,而对于用户而言,他们是感知不到CP和SP的存在的,只会认为是对话系统处理慢。
发明内容
本发明实施例提供一种语音对话方法及装置,用于至少解决上述技术问题之一。
第一方面,本发明实施例提供一种语音对话方法,包括:
根据用户语音请求确定能够响应所述用户语音请求的目标应用服务;
获取所述目标应用服务响应用户语音请求的平均响应时间,所述平均响应时间基于所述目标应用服务响应用户语音请求的历史响应时间确定;
当所述平均响应时间大于第一设定阈值时,通过网站应用程序接口调用所述目标应用服务,并向用户推送等待过渡信息;
通过所述网站应用程序接口接收所述目标应用服务所返回的应答结果;将所述应答结果呈现给用户。
第二方面,本发明实施例提供一种语音对话装置,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州思必驰信息科技有限公司,未经苏州思必驰信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811444913.7/2.html,转载请声明来源钻瓜专利网。