[发明专利]从统计文本到语音合成系统输出的语音的统计增强有效
申请号: | 201280033177.0 | 申请日: | 2012-06-28 |
公开(公告)号: | CN103635960A | 公开(公告)日: | 2014-03-12 |
发明(设计)人: | A·索林;S·谢克特曼 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G10L13/033 | 分类号: | G10L13/033 |
代理公司: | 北京市中咨律师事务所 11247 | 代理人: | 于静;张亚非 |
地址: | 美国*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 述一种用于增强由统计文本到语音(TTS)系统合成的语音的方法,所述系统在声学特征向量空间中采用语音的参数表示。所述方法包括:定义一系列参数纠正变换,所述纠正变换工作在所述声学特征向量空间中并依赖于一组增强参数;以及定义一个特征向量或多个特征向量的失真指示符。所述方法还包括:接收所述系统输出的特征向量;以及通过以下操作生成所述纠正变换的实例:计算所述失真指示符的参考值,所述参考值由发出所述特征向量的语音单位的统计模型产生;计算所述失真指示符的实际值,所述实际值由发出所述特征向量的所述语音单位的所述统计模型所发出的特征向量产生;根据所述失真指示符的所述参考值、所述失真指示符的所述实际值和所述参数纠正变换,计算增强参数值;以及从所述一系列参数纠正变换获得与所述增强参数值对应的所述纠正变换的实例。可以将所述纠正变换的所述实例应用于所述特征向量以提供增强的特征向量。 | ||
搜索关键词: | 统计 文本 语音 合成 系统 输出 增强 | ||
【主权项】:
一种用于增强由统计文本到语音(TTS)系统合成的语音的方法,所述系统在声学特征向量空间中采用语音的参数表示,所述方法包括:定义一系列参数纠正变换,所述纠正变换工作在所述声学特征向量空间中并依赖于一组增强参数;定义一个特征向量或多个特征向量的失真指示符;接收所述系统输出的特征向量;通过以下操作生成所述纠正变换的实例:计算所述失真指示符的参考值,所述参考值由发出所述特征向量的语音单位的统计模型产生;计算所述失真指示符的实际值,所述实际值由发出所述特征向量的所述语音单位的所述统计模型所发出的特征向量产生;根据所述失真指示符的所述参考值、所述失真指示符的所述实际值和所述参数纠正变换,计算增强参数值;从所述一系列参数纠正变换获得与所述增强参数值对应的所述纠正变换的实例;以及将所述纠正变换的所述实例应用于所述特征向量以提供增强的特征向量。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201280033177.0/,转载请声明来源钻瓜专利网。