[发明专利]情感语音合成方法和系统有效
申请号: | 201010271135.3 | 申请日: | 2010-08-31 |
公开(公告)号: | CN102385858A | 公开(公告)日: | 2012-03-21 |
发明(设计)人: | 双志伟;包胜华;陈健;刘文;张世磊;苏中;施勤;秦勇 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G10L13/00 | 分类号: | G10L13/00;G10L13/06 |
代理公司: | 北京市中咨律师事务所 11247 | 代理人: | 于静;杨晓光 |
地址: | 美国*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 情感 语音 合成 方法 系统 | ||
1.一种情感语音合成方法,包括:
接收文本数据;
对所述文本数据按韵律单元生成情感标记,其中所述情感标记被表示为一组情感矢量,所述情感矢量包括依据多个情感类型所给出的多个情感分数;以及
按照所述情感标记对所述文本数据进行语音合成。
2.如权利要求1所述的方法,其中对所述文本数据按韵律单元生成情感标记进一步包括:
确定所述多个情感分数中的最大值作为最终情感分数,并且将所述最终情感分数所代表的情感类型作为最终情感类型,以及
其中按照所述情感标记对所述文本数据进行语音合成进一步包括:
按照所述韵律单元的最终情感分数和最终情感类型对所述文本数据进行语音合成。
3.如权利要求1所述的方法,其中对所述文本数据按韵律单元生成情感标记进一步包括:
按照所述韵律单元的上下文对所述情感矢量进行调整,
根据调整后的各个情感分数确定所述韵律单元的最终情感分数和最终情感类型,并且
其中按照所述情感标记对所述文本数据进行语音合成进一步包括:
按照所述韵律单元的最终情感分数和最终情感类型对所述文本数据进行语音合成。
4.如权利要求3所述的方法,其中对所述情感矢量进行调整进一步包括:
根据情感矢量调整决策树对所述韵律单元的情感分数进行调整,其中所述情感矢量调整决策树是基于情感矢量调整训练数据建立起来的。
5.如权利要求1所述的方法,进一步包括:
基于所述韵律单元的情感标记对所述文本数据进行情感平滑处理。
6.如权利要求5所述的方法,其中对所述文本数据进行情感平滑处理进一步包括:
对至少一个韵律单元的一种情感类型获得其与另一个相邻韵律单元的一种情感类型的情感连接的相邻概率;
基于所述相邻概率以及各个情感类型的情感分数确定所述文本数据的最终情感路径;以及
根据所述最终情感路径确定韵律单元的最终情感类型。
7.如权利要求6所述的方法,其中确定韵律单元的最终情感类型进一步包括:
获取所述最终情感类型的情感分数作为最终情感分数,并且
其中按照所述情感标记对所述文本数据进行语音合成进一步包括:
按照所述韵律单元的最终情感分数和最终情感类型对所述文本数据进行语音合成。
8.如权利要求6所述的方法,其中所述相邻概率是根据对情感相邻训练数据进行统计而得到的,并且所述统计进一步包括:
记录所述情感相邻训练数据中至少两种情感类型相邻的次数。
9.如权利要求8所述的方法,进一步包括:
基于所形成的最终情感路径自动对所述情感相邻训练数据进行扩展。
10.如权利要求8所述的方法,进一步包括:
通过连接所述韵律单元的情感分数最大的情感类型从而自动对所述情感相邻训练数据进行扩展。
11.如权利要求2、3或7之一所述的方法,所述按照所述韵律单元的最终情感分数和最终情感类型对所述文本数据进行语音合成进一步包括:
将所述韵律单元分解为音素;以及
对于所述音素根据下述公式确定其语音特征:
Fi=(1-Pemotion)*Fi-neutral+Pemotion*Fi-emotion
其中Fi表示所述音素的第i项语音特征取值,Pemotion表示所述音素所在韵律单元的最终情感分数,Fi-neutral表示第i项语音特征在中性情感类型中的语音特征取值,Fi-emotion表示第i项语音特征在所述最终情感类型中的语音特征取值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010271135.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:晶圆位置的检测装置
- 下一篇:一种铝合金三维发光字