[发明专利]语音交互方法、装置、电子设备和存储介质在审
申请号: | 202011254837.0 | 申请日: | 2020-11-11 |
公开(公告)号: | CN112382287A | 公开(公告)日: | 2021-02-19 |
发明(设计)人: | 李循;袁俊 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/30;G10L13/04;G10L13/10;G10L25/63 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 韩海花 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 交互 方法 装置 电子设备 存储 介质 | ||
1.一种语音交互方法,包括:
获取用户语音;
根据对用户语音识别得到的交互上文,从语料库中确定用于回复所述交互上文的交互下文;
获取所述交互下文对应的情感类型;
根据所述情感类型和设定音色,对所述交互下文进行语音合成,以得到回复语音;
采用所述回复语音进行语音交互。
2.根据权利要求1所述的语音交互方法,其中,所述根据所述情感类型,和设定音色,对所述交互下文进行语音合成,以得到回复语音,包括:
将所述情感类型对应语音的第一梅尔谱mel特征和所述设定音色对应语音的第二梅尔谱mel特征、以及所述交互下文输入经过训练的语音合成模型,以得到所述回复语音。
3.根据权利要求2所述的语音交互方法,其中,所述语音合成模型,包括:
风格编码器,用于输入所述第一mel特征以得到风格编码;
音色编码器,用于输入所述第二mel特征以得到音色编码;
文本编码器,用于输入所述交互下文以得到文本编码;
解码器,用于输入所述文本编码、所述风格编码和所述音色编码以得到目标mel特征;
声码器,用于输入所述目标mel特征以得到所述回复语音。
4.根据权利要求2所述的语音交互方法,其中,所述语音合成模型分别采用第一训练样本和第二训练样本训练得到;
其中,所述第一训练样本,用于对所述语音合成模型进行第一阶段训练;所述第一训练样本包括采用至少一种音色录制的多种情感类型的第一语音,以及所述第一语音对应的文本;
所述第二训练样本,用于对所述语音合成模型进行第二阶段训练;所述第二训练样本包括采用所述设定音色录制的第二语音,以及所述第二语音对应的文本和情感类型。
5.根据权利要求1-4任一项所述的方法,其中,所述获取所述交互下文对应的情感类型,包括:
查询所述交互下文对应的情感标签;其中,所述情感标签是采用情感分类模型对所述交互下文进行分类得到的;
根据所述情感标签,确定所述情感类型。
6.一种语音交互装置,包括:
第一获取模块,用于获取用户语音;
确定模块,用于根据对用户语音识别得到的交互上文,从语料库中确定用于回复所述交互上文的交互下文;
第二获取模块,用于获取所述交互下文对应的情感类型;
合成模块,用于根据所述情感类型和设定音色,对所述交互下文进行语音合成,以得到回复语音;
交互模块,用于采用所述回复语音进行语音交互。
7.根据权利要求6所述的语音交互装置,其中,所述合成模块,用于:
将所述情感类型对应语音的第一mel特征和所述设定音色对应语音的第二mel特征、以及所述交互下文输入经过训练的语音合成模型,以得到所述回复语音。
8.根据权利要求7所述的语音交互装置,其中,所述语音合成模型,包括:
风格编码器,用于输入所述第一mel特征以得到风格编码;
音色编码器,用于输入所述第二mel特征以得到音色编码;
文本编码器,用于输入所述交互下文以得到文本编码;
解码器,用于输入所述文本编码、所述风格编码和所述音色编码以得到目标mel特征;
声码器,用于输入所述目标mel特征以得到所述回复语音。
9.根据权利要求7所述的语音交互装置,其中,所述语音合成模型分别采用第一训练样本和第二训练样本训练得到;
其中,所述第一训练样本,用于对所述语音合成模型进行第一阶段训练;所述第一训练样本包括采用至少一种音色录制的多种情感类型的第一语音,以及所述第一语音对应的文本;
所述第二训练样本,用于对所述语音合成模型进行第二阶段训练;所述第二训练样本包括采用所述设定音色录制的第二语音,以及所述第二语音对应的文本和情感类型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011254837.0/1.html,转载请声明来源钻瓜专利网。