[发明专利]语音合成设备有效

申请号：	201210175478.9	申请日：	2012-05-30
公开（公告）号：	CN102810309A	公开（公告）日：	2012-12-05
发明（设计）人：	若尔迪·博纳达;梅利因·布洛乌;橘诚	申请（专利权）人：	雅马哈株式会社
主分类号：	G10L13/04	分类号：	G10L13/04
代理公司：	北京天昊联合知识产权代理有限公司 11112	代理人：	陈源;张天舒
地址：	日本***	国省代码：	日本;JP
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音合成设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种语音合成设备，包括：

音素段内插部分，其获取一个音素段的第一音素段数据以及该音素段的第二音素段数据，所述第一音素段数据包括多个帧的序列并且对应于声音特性的第一值，所述第二音素段数据包括多个帧的序列并且对应于与所述声音特性的第一值不同的该声音特性的第二值，所述第一音素段数据和所述第二音素段数据表示了所述音素段的每个帧的频谱，

其中，在第一音素段数据的一个帧和第二音素段数据的与第一音素段数据的这个帧相对应的一个帧都表示浊音的情况下，音素段内插部分以与所述声音特性的一个目标值对应的内插率来在第一音素段数据的帧的频谱和第二音素段数据的与第一音素段数据的这个帧相对应的帧的频谱之间进行内插，以产生所述音素段的对应于所述目标值的音素段数据，其中所述目标值不同于所述声音特性的第一值和第二值；以及

语音合成部分，其根据由所述音素段内插部分所产生的音素段数据来生成具有所述声音特性的目标值的语音信号。

2.根据权利要求1所述的语音合成设备，其中第一音素段数据和第二音素段数据包括表示了每个帧的频谱形状特性的形状参数，并且其中音素段内插部分以与所述声音特性的目标值对应的内插率来在第一音素段数据的帧的频谱的形状参数和第二音素段数据的与第一音素段数据的这个帧相对应的帧的频谱的形状参数之间进行内插。

3.根据权利要求1所述的语音合成设备，其中在第一音素段数据的帧或第二音素段数据的与第一音素段数据的这个帧相对应的帧表示清音的情况下，音素段内插部分以与所述声音特性的目标值对应的内插率来在第一音素段数据的帧的音量和第二音素段数据的与第一音素段数据的这个帧相对应的帧的音量之间进行内插，并且根据内插后的音量来对第一音素段数据的帧的频谱进行校正，以产生目标值的音素段数据。

4.根据权利要求1或2所述的语音合成设备，还包括连续音内插部分，该连续音内插部分获取第一连续音数据和第二连续音数据，并且在第一连续音数据和第二连续音数据之间进行内插以产生对应于目标值的连续音数据，所述第一连续音数据表示了一个连续音的第一波动成分并且对应于所述声音特性的第一值，所述第二连续音数据表示了该连续音的第二波动成分并且对应于所述声音特性的第二值，其中所述语音合成部分使用由音素段内插部分所产生的音素段数据以及由连续音内插部分所产生的连续音数据来产生语音信号。

5.根据权利要求4所述的语音合成设备，其中连续音内插部分从第一连续音数据中提取各自具有时间长度的多个第一单位片段，并沿时间轴排列这些第一单位片段以产生第一中间数据，并且连续音内插部分从第二连续音数据中提取各自具有与第一单位片段的时间长度相等的时间长度的多个第二单位片段，并沿时间轴排列这些第二单位片段以产生第二中间数据，并且连续音内插部分在第一中间数据和第二中间数据之间进行内插以产生与所述声音特性的目标值对应的连续音数据。

6.根据权利要求1至5中任一项所述的语音合成设备，其中在第一音素段数据的一个帧和第二音素段数据的与第一音素段数据的这个帧相对应的一个帧之间的声音特性的差异大于预定阈值的情况下，音素段内插部分产生这样的目标值的音素段数据：使得第一音素段数据和第二音素段数据之一在所产生的音素段数据中相比第一音素段数据和第二音素段数据中的另一个更占优势。

7.一种语音合成方法，包括：

获取一个音素段的第一音素段数据，该第一音素段数据包括多个帧的序列并且对应于声音特性的第一值，该第一音素段数据表示了所述音素段的每个帧的频谱；

获取所述音素段的第二音素段数据，该第二音素段数据包括多个帧的序列并且对应于与所述声音特性的第一值不同的该声音特性的第二值，该第二音素段数据表示了所述音素段的每个帧的频谱；

在第一音素段数据的一个帧和第二音素段数据的与第一音素段数据的这个帧相对应的一个帧都表示浊音的情况下，以与所述声音特性的一个目标值对应的内插率来在第一音素段数据的帧的频谱和第二音素段数据的与第一音素段数据的这个帧相对应的帧的频谱之间进行内插，以产生所述音素段的对应于目标值的音素段数据，其中所述目标值不同于所述声音特性的第一值和第二值；以及

根据所产生的音素段数据来生成具有所述声音特性的目标值的语音信号。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于雅马哈株式会社，未经雅马哈株式会社许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201210175478.9/1.html，转载请声明来源钻瓜专利网。

上一篇：一种橙色氮氧化物荧光粉材料的制备方法
下一篇：无胶水环保线盘

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L13-00 语音合成；文本-语音合成系统
G10L13-02 .产生合成语音的方法；语音合成设备
G10L13-06 .语音合成设备中使用的基本语音单位；级联规则
G10L13-08 .文本分析或文本以外的语音合成参数的产生，例如语义图翻译为音素、韵律产生、重音或声调测定
G10L13-04 ..语音合成系统的零部件，例如合成设备结构或存储器管理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]语音合成设备有效

专利文献下载