[发明专利]一种融合词汇及音素发音特征的情感语音合成方法及系统有效
申请号: | 202110600732.4 | 申请日: | 2021-05-31 |
公开(公告)号: | CN113257225B | 公开(公告)日: | 2021-11-02 |
发明(设计)人: | 郑书凯;李太豪;裴冠雄 | 申请(专利权)人: | 之江实验室 |
主分类号: | G10L13/10 | 分类号: | G10L13/10;G10L13/08;G06F40/289;G06F40/30 |
代理公司: | 杭州浙科专利事务所(普通合伙) 33213 | 代理人: | 孙孟辉 |
地址: | 310023 浙江省杭州市余*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明属于人工智能领域,具体涉及一种融合词汇及音素发音特征的情感语音合成方法及系统,该方法为:通过录音采集设备,采集文本及情感标签,对所述文本进行预处理,获取音素及音素对齐信息,生成分词及分词语义信息,分别计算并得到分词发音时长信息、分词发音语速信息、分词发音能量信息、音素基频信息,分别训练分词语速预测网络、分词能量预测网络、音素基频预测网络,获取并拼接音素隐含信息、分词语速隐含信息、分词能量隐含信息、音素基频隐含信息,合成情感语音。本发明通过将与情感发音有关的词汇及音素发音特征融合到端到端语音合成模型中去,能够使得合成的情感语音更加自然。 | ||
搜索关键词: | 一种 融合 词汇 音素 发音 特征 情感 语音 合成 方法 系统 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于之江实验室,未经之江实验室许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202110600732.4/,转载请声明来源钻瓜专利网。