[发明专利]多角色语音的交互方法、电子设备和存储介质在审
申请号: | 202111649321.0 | 申请日: | 2021-12-30 |
公开(公告)号: | CN114283820A | 公开(公告)日: | 2022-04-05 |
发明(设计)人: | 宋泽;甘津瑞;陈铭竑;邓建凯 | 申请(专利权)人: | 思必驰科技股份有限公司 |
主分类号: | G10L17/04 | 分类号: | G10L17/04;G10L17/22;G10L15/18;G10L25/63 |
代理公司: | 北京商专永信知识产权代理事务所(普通合伙) 11400 | 代理人: | 黄谦;侯晓艳 |
地址: | 215123 江苏省苏州市苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 角色 语音 交互 方法 电子设备 存储 介质 | ||
1.一种多角色语音的交互方法,所述交互方法能够在包括本地用户端和远程端的系统中实现;在所述远程端设置语音识别服务器;所述交互方法包括:
将所述本地用户端获取的交互音频数据发送到所述远程端的语音识别服务器进行处理,从所述语音识别服务器得到所述交互音频数据的语义识别结果;
所述语音识别服务器通过对话模型识别所述语义识别结果,获取对话结果;所述语音识别服务器根据所述对话结果获取设定角色信息;
所述语音识别服务器根据所述设定角色信息及所述对话信息合成回复语音;所述语音识别服务将所述回复语音发送到本地用户端;所述本地用户端播放所述回复语音。
2.根据权利要求1所述的交互方法,其中,所述交互音频数据包括:问句语音音频数据或答句语音音频数据。
3.根据权利要求1所述的交互方法,其中,所述将所述本地用户端获取的交互音频数据发送到所述远程端的语音识别服务器进行处理,从所述语音识别服务器得到所述交互音频数据的语义识别结果的步骤包括:
所述语音识别服务器根据所述音频数据获取其对应的待识别文字数据;通过语义识别模型识别所述待识别文字数据获取语义识别结果信息。
4.根据权利要求1所述的交互方法,其中,在所述远程端设置情绪识别服务器;
所述语音识别服务器根据所述对话结果获取设定角色信息的步骤还包括:将所述对话结果信息发送至所述情绪识别服务器;所述情绪识别服务器通过本地模型或识别算法获取情感结果信息;所述情感结果信息包括:性别、年龄、情绪和音色信息。
5.根据权利要求4所述的交互方法,其中,所述语音识别服务器根据所述设定角色信息及所述对话信息合成回复语音的步骤还包括:所述远程端获取所述本地用户端的当前角色信息;判断所述当前角色信息是否为设定角色信息,若否,则将所述设定角色信息设定为当前角色信息。
6.根据权利要求1所述的交互方法,其中,所述语音识别服务器通过对话模型识别所述语义识别结果信息,获取对话结果信息的步骤包括:所述语音识别服务器通过基于自然语言算法模型的对话模型识别所述语义识别结果信息;
所述语义识别结果信息包括:用户说话内容;用户的任务字段;用户任务的意图字段和对话服务的回复语字段。
7.根据权利要求1所述的交互方法,其中,所述语音识别服务将所述回复语音发送到本地用户端;所述本地用户端播放所述回复语音的步骤包括:所述语音识别服务将所述回复语音通过http协议返回16K 16bit的PCM数据发送到本地用户端。
8.根据权利要求1所述的交互方法,其中,所述本地用户端获取音频数据的步骤包括:所述本地用户端配置包括智能移动终端的设备,通过所述智能移动终端采集音频数据;
所述音频数据为格式为16K 16bit单通道的PCM脉冲编码调制数据。
9.一种电子设备,其包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1至8任一项所述方法的步骤。
10.一种存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现权利要求1至8任一项所述方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于思必驰科技股份有限公司,未经思必驰科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111649321.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种腈水解酶突变体、工程菌及其应用
- 下一篇:一种储水装置温度检测方法