[发明专利]语音交互方法、装置、电子设备、存储介质有效
申请号: | 201810011889.1 | 申请日: | 2018-01-05 |
公开(公告)号: | CN108257590B | 公开(公告)日: | 2020-10-02 |
发明(设计)人: | 马艳丽 | 申请(专利权)人: | 携程旅游信息技术(上海)有限公司 |
主分类号: | G10L13/04 | 分类号: | G10L13/04;G10L13/08;G10L15/22;G10L15/30 |
代理公司: | 上海隆天律师事务所 31282 | 代理人: | 臧云霄;潘一诺 |
地址: | 201203 上海市浦东新*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 交互 方法 装置 电子设备 存储 介质 | ||
1.一种语音交互方法,其特征在于,包括:
步骤S110:接收来自客户端的语音交互服务请求,所述语音交互服务请求包含语音服务类型及对应该语音服务类型的语音服务引擎,所述语音服务类型包括TTS类型及ASR类型,所述TTS类型的语音交互服务请求包含第一文本信息,所述TTS类型的语音交互服务请求包含第一音频信息;
步骤S120:根据所述语音交互服务请求判断其语音服务类型;
步骤S131:若所述语音服务类型为TTS类型,则直接将所述语音交互服务请求转发至所述语音交互服务请求包含的所述语音服务引擎;
步骤S132:若所述语音服务类型为ASR类型,则对所述第一音频信息进行格式转换以适配所述语音交互服务请求包含的所述语音服务引擎,并将包含格式转换后的第一音频信息的语音交互服务请求转发至所述语音交互服务请求包含的所述语音服务引擎;
步骤S140:接收来自所述语音服务引擎的语音交互反馈信息;
步骤S150:判断所述语音交互反馈信息对应的语音交互服务请求的语音服务类型;
步骤S161:若所述语音交互反馈信息对应于所述TTS类型的语音交互服务请求,则所述语音交互反馈信息包含第二音频信息,并对所述第二音频信息进行格式转换以适配所述客户端,并将包含格式转换后的第二音频信息的语音交互反馈信息转发至所述客户端;
步骤S162:若所述语音交互反馈信息对应于所述ASR类型的语音交互服务请求,则直接将所述语音交互反馈信息转发至所述客户端。
2.如权利要求1所述的语音交互方法,其特征在于,所述步骤S110之后,所述步骤S120之前还包括:
步骤S101:判断所述语音交互服务请求包含的所述语音服务引擎是否异常;
步骤S102:若异常,则在多个对应该语音服务类型的语音服务引擎中选择服务性能最优的语音服务引擎以替换所述语音交互服务请求包含的所述语音服务引擎。
3.如权利要求1所述的语音交互方法,其特征在于,所述格式转换包括如下任一个或多个音频参数的调整:
语音格式、采样率、采样深度以及声道数。
4.如权利要求1所述的语音交互方法,其特征在于,所述格式转换基于sox开源软件进行。
5.如权利要求1所述的语音交互方法,其特征在于,所述客户端所在的设备上安装有多个语音交互应用,各语音交互应用绑定至少一个语音服务引擎,所述语音交互服务请求还包含所述语音交互应用的标识及该语音交互应用绑定的语音服务引擎。
6.如权利要求1所述的语音交互方法,其特征在于,所述语音交互服务请求来自第一客户端,所述语音交互服务器请求包括第一客户端的标识、第二客户端的标识,
所述步骤S161包括:
若所述语音交互反馈信息对应于所述TTS类型的语音交互服务请求,则所述语音交互反馈信息包含第二音频信息;
根据所述第一客户端的标识对所述第二音频信息进行格式转换以适配所述第一客户端,并将包含格式转换后的第二音频信息的语音交互反馈信息转发至所述第一客户端;
根据所述第二客户端的标识对所述第二音频信息进行格式转换以适配所述第二客户端,缓存包含格式转换后的第二音频信息的语音交互反馈信息,根据所述语音交互反馈信息生成一提取码,将所述提取码转发至所述第二客户端;
接收所述第二客户端发送的提取码,并将所述语音交互反馈信息转发所述第二客户端。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于携程旅游信息技术(上海)有限公司,未经携程旅游信息技术(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810011889.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种谱曲方法及装置
- 下一篇:一种音乐的识别方法及系统