[发明专利]一种模拟说话者情绪优化翻译后文本语音合成的方法在审
申请号: | 201810601584.6 | 申请日: | 2018-06-12 |
公开(公告)号: | CN108831436A | 公开(公告)日: | 2018-11-16 |
发明(设计)人: | 张岩;林彦;熊涛 | 申请(专利权)人: | 深圳市合言信息科技有限公司 |
主分类号: | G10L13/02 | 分类号: | G10L13/02;G10L13/08;G10L17/00;G10L25/63 |
代理公司: | 深圳市凯达知识产权事务所 44256 | 代理人: | 刘大弯 |
地址: | 518000 广东省深圳市南山*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种模拟说话者情绪优化翻译后文本语音合成的方法,首先获取用户的语音信息;后台对音频文件进行分析,得到频率、语速参数;后台通过导入到声纹识别系统,得到性别、年龄等参数;将语音通过语音识别得到文本信息;通过文本的语法,用词,通过文本语句分析,得出情绪参数;结合频率、语速、性别、年龄、情绪多个特征,设定每个特征的特征值;通过特征值结合语音合成SSML语法,对合成语音的SSML语法中播报速度、音量大小、字词停顿进行设置。从而实现合成的其他国家语音播报反映出说话者说本国语言的情绪特征。本发明通过识别说话者的语气、语调、用词、语法等声音与语言特征,使得最终语音翻译合成播报如实反映当前说话者的情绪。 | ||
搜索关键词: | 合成 语法 说话 情绪 文本语音 播报 后台 语音 声纹识别系统 翻译 情绪参数 情绪特征 文本信息 文本语句 音频文件 语言特征 语音播报 语音翻译 语音合成 语音识别 语音信息 音量 停顿 优化 分析 文本 语言 | ||
【主权项】:
1.一种模拟说话者情绪优化翻译后文本语音合成的方法,包括与业务后台信号连接的翻译设备,其特征在于,所述翻译设备通过业务后台信号连接有语音识别接口、声纹识别接口、语法分析接口、翻译接口和语音合成接口。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市合言信息科技有限公司,未经深圳市合言信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810601584.6/,转载请声明来源钻瓜专利网。