[发明专利]语音服务方法、系统、电子设备及存储介质在审
申请号: | 202010561374.6 | 申请日: | 2018-06-26 |
公开(公告)号: | CN111755009A | 公开(公告)日: | 2020-10-09 |
发明(设计)人: | 吴旺;张顺;龚建明 | 申请(专利权)人: | 苏州思必驰信息科技有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L15/34;G10L13/04 |
代理公司: | 北京商专永信知识产权代理事务所(普通合伙) 11400 | 代理人: | 方挺;车江华 |
地址: | 215123 江苏省苏州市苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 服务 方法 系统 电子设备 存储 介质 | ||
本发明公开一种语音服务方法、系统、电子设备及存储介质,其中,所述方法包括:接收终端设备所发起的语音请求;确定用于响应所述语音请求的文本内容;至少发送所述文本内容至所述终端设备;将基于所述文本内容所合成的音频数据发送至所述终端设备。本发明实施例的方法中,因为基于语音请求确定相应的文本内容所消耗的时间,相对于基于文本内容合成相应的音频数据所消耗的时间要短很多,所以,本发明实施例的方法采用先后以文本内容形式和音频形式响应用户请求的能够保证对用户请求的及时应答,避免用户等待时间过长,提升用户体验。
本申请是申请号为2018106679014的中国专利申请的分案申请,该中国专利申请的申请日为:2018年6月26日,名称为:语音服务方法、系统、电子设备及存储介质。
技术领域
本发明涉及语音识别技术领域,尤其涉及语音服务方法、系统、电子设备及存储介质。
背景技术
随着语音识别技术的不断发展,越来越多的成熟的语音服务产品为用户提供者便捷的语音服务,例如,各种语音助手的出现,使得用户查询获取信息的形式不再仅仅限于手动输入进行查询,可以直接进行语音输入来查询获取所需内容,相应的所获得的内容也不再仅仅限于传统的图文形式,还能够同时获得音频形式的信息。
然而,由于受合成音频数据的合成算法的效率的影响,在为用户提供同步的图文和音频信息时,往往会造成较长的延时。例如,亚马逊的AVS(Alexa Voice Service亚马逊智能对话服务)云端对话采用文本回复和语音回复结合的方式,云端先计算得到文本回复,但是文本回复要等合成计算返回语音回复后再一起向用户终端设备返回。这样做,从用户视角看,会造成从发送完语音请求到收到回复消息这之间的延时偏大。
为解决音频数据的合成算法所带来的延时问题,相关技术专家进行了越来越多的关于音频数据合成算法的优化方法的研究,但最终效果始终不够理想。
发明内容
本发明实施例提供一种语音服务方法、系统、电子设备及存储介质,用于至少解决上述技术问题之一。
第一方面,本发明实施例提供一种语音服务方法,包括:
接收终端设备所发起的语音请求;
确定用于响应所述语音请求的文本内容;
至少发送所述文本内容至所述终端设备;
将基于所述文本内容所合成的音频数据发送至所述终端设备。
第二方面,本发明实施例提供另一种语音服务方法,包括:
发送语音请求至云端服务器;
至少接收所述云端服务器所发送的用于响应所述语音请求的文本内容;
接收所述云端服务器基于所述文本内容所合成的音频数据。
第三方面,本发明实施例提供一种语音服务系统,包括:
中控节点,用于接收终端设备所发起的语音请求;
文本内容确定节点,用于接收所述中控节点所分配的语音请求,并确定用于响应所述语音请求的文本内容,以用于所述中控节点至少发送所述文本内容至所述终端设备;
音频数据合成节点,用于基于所述文本内容合成相应的音频数据,所述中控节点还用于将基于所述文本内容所合成的音频数据发送至所述终端设备。
第四方面,本发明实施例提供一种存储介质,所述存储介质中存储有一个或多个包括执行指令的程序,所述执行指令能够被电子设备(包括但不限于计算机,服务器,或者网络设备等)读取并执行,以用于执行本发明上述任一项语音服务方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州思必驰信息科技有限公司,未经苏州思必驰信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010561374.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:目标检测方法、装置及设备
- 下一篇:一种应用容器的创建方法、装置及设备