[发明专利]一种模拟说话者情绪优化翻译后文本语音合成的方法在审
申请号: | 201810601584.6 | 申请日: | 2018-06-12 |
公开(公告)号: | CN108831436A | 公开(公告)日: | 2018-11-16 |
发明(设计)人: | 张岩;林彦;熊涛 | 申请(专利权)人: | 深圳市合言信息科技有限公司 |
主分类号: | G10L13/02 | 分类号: | G10L13/02;G10L13/08;G10L17/00;G10L25/63 |
代理公司: | 深圳市凯达知识产权事务所 44256 | 代理人: | 刘大弯 |
地址: | 518000 广东省深圳市南山*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 合成 语法 说话 情绪 文本语音 播报 后台 语音 声纹识别系统 翻译 情绪参数 情绪特征 文本信息 文本语句 音频文件 语言特征 语音播报 语音翻译 语音合成 语音识别 语音信息 音量 停顿 优化 分析 文本 语言 | ||
1.一种模拟说话者情绪优化翻译后文本语音合成的方法,包括与业务后台信号连接的翻译设备,其特征在于,所述翻译设备通过业务后台信号连接有语音识别接口、声纹识别接口、语法分析接口、翻译接口和语音合成接口。
2.根据权利要求1所述的一种模拟说话者情绪优化翻译后文本语音合成的方法,其特征在于,语音翻译合成步骤为:
步骤一:翻译设备获取用户的语音voice,得到WAV格式;
步骤二:业务后台对音频文件进行分析,得到频率、语速参数;
步骤三:业务后台将语音信息导入到声纹识别接口,通过声纹识别系统识别得到用户性别、年龄等参数;
步骤四:业务后台将语音信息导入到语音识别接口,通过语音识别系统得到文本信息;
步骤五:业务后台将识别后的文本信息导入到语法分析接口,通过语法分析系统对文本的语法,用词,通过文本语句分析,得出情绪参数,例如,开心、生气、愤怒、消极等;
步骤六:业务后台结合各系统分析得到的频率、语速、性别、年龄、情绪多个特征参数,设定每个特征的特征值;
步骤七:业务后台将用户识别后的文字导入翻译接口,通过翻译系统翻译得到目标语言的文本;
步骤八:业务后台将翻译得到的语言文本和分析得到的特征值导入语音合成接口,使语音合成系统通过特征值结合语音合成SSML语法,对合成语音的SSML语法中播报速度、音量大小、字词停顿进行设置,从而实现合成的其他国家语音播报反映出说话者说本国语言的情绪特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市合言信息科技有限公司,未经深圳市合言信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810601584.6/1.html,转载请声明来源钻瓜专利网。