[发明专利]信息处理方法、装置、设备和计算机存储介质有效
申请号: | 202010589690.4 | 申请日: | 2020-06-24 |
公开(公告)号: | CN111754974B | 公开(公告)日: | 2021-08-10 |
发明(设计)人: | 丁磊;周宏波 | 申请(专利权)人: | 华人运通(上海)云计算科技有限公司 |
主分类号: | G10L13/02 | 分类号: | G10L13/02;G10L13/04;G10L13/047;G10L13/08 |
代理公司: | 北京市铸成律师事务所 11313 | 代理人: | 阎敏;杨瑾瑾 |
地址: | 201114 上海市闵*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信息处理 方法 装置 设备 计算机 存储 介质 | ||
1.一种信息处理方法,其特征在于,包括:
接收第一应用的请求信息;所述请求信息中包含的待转换内容,包括以下至少之一:待转换文本信息、待转换音频信息、待转换语法信息;
基于所述第一应用的请求信息中包含的场景标识和/或第一应用的标识确定本次音频处理的目标场景,基于所述本次音频处理的目标场景确定对应的至少一个目标风格;
根据确定的至少一个目标风格,对所述第一应用的请求信息中包含的待转换内容进行处理,得到与所述至少一个目标风格所对应的目标语音合成标记语言SSML;其中,所述目标SSML中包括音频相关属性的标记;
选取与所述至少一个目标风格对应的语音模型;基于选取的所述语音模型对所述目标SSML进行音频合成,得到所述至少一个目标风格所对应的目标音频信息;
所述对所述第一应用的请求信息中包含的待转换内容进行处理,得到与所述至少一个目标风格所对应的目标语音合成标记语言SSML,包括以下至少之一:
若所述第一应用的请求信息中包含的待转换内容为待转换文本信息,则根据所述至少一个目标风格对所述待转换文本信息进行音频相关属性的标记,得到所述目标SSML;
若所述第一应用的请求信息中包含的待转换内容为待转换音频信息,则将所述待转换音频信息添加至所述目标SSML,根据所述至少一个目标风格确定对应的音频相关属性的标记,得到所述目标SSML;
若所述第一应用的请求信息中包含的待转换内容为待转换语法信息,则对所述待转换语法信息进行规范化处理,得到与所述至少一个目标风格所对应的所述目标SSML;
所述方法还包括:
基于所述本次音频处理的目标场景确定对应的音频输出通道;
在所述音频输出通道能够进行音频输出的情况下,将所述至少一个目标风格所对应的目标音频信息加入所述对应的音频输出通道的输出队列;
通过所述音频输出通道输出所述输出队列中的所述目标音频信息。
2.根据权利要求1所述的方法,其特征在于,所述基于所述本次音频处理的目标场景确定对应的至少一个目标风格,包括:
根据至少一个场景中不同场景与不同风格之间的对应关系,确定本次音频处理的目标场景所对应的至少一个目标风格。
3.根据权利要求1所述的方法,其特征在于,基于与所述至少一个目标风格所对应的所述目标SSML进行音频合成,得到所述至少一个目标风格所对应的目标音频信息,包括:
将与所述至少一个目标风格所对应的所述目标SSML上传至云端引擎,接收所述云端引擎返回的与所述目标SSML对应的目标音频信息。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在与语音云端服务器进行连接的情况下,从所述语音云端服务器获取更新后的语音模型;其中,所述更新后的语音模型中至少包括所述与所述至少一个目标风格对应的语音模型。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
收到所述第一应用发来的取消音频播放的请求时,控制停止进行音频合成;
和/或,收到所述第一应用发来的取消音频输出通道的请求时,控制释放所述音频输出通道。
6.根据权利要求2所述的方法,其特征在于,所述方法还包括:
在可替换配置文本中保存预设的至少一个场景中不同场景与不同风格之间的对应关系。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华人运通(上海)云计算科技有限公司,未经华人运通(上海)云计算科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010589690.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:密封隔离仓
- 下一篇:一种基于深浅层特征融合的鲁棒性说话人识别方法