[发明专利]语音合成装置和方法以及存储有语音合成程序的记录介质在审

申请号：	201410098488.6	申请日：	2014-03-17
公开（公告）号：	CN104050961A	公开（公告）日：	2014-09-17
发明（设计）人：	入山达也	申请（专利权）人：	雅马哈株式会社
主分类号：	G10L13/033	分类号：	G10L13/033;G10L13/04
代理公司：	北京天昊联合知识产权代理有限公司 11112	代理人：	陈源;李铭
地址：	日本***	国省代码：	日本;JP
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音合成装置方法以及存储程序记录介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

相关申请的交叉引用

本申请要求日本申请JP2013-052758的优先权。该日本申请的内容在此通过引用合并于本申请中。

技术领域

本发明涉及语音合成装置、语音合成方法和存储有语音合成程

序的记录介质。

背景技术

这种语音合成技术的示例包括声乐合成技术，该声乐合成技术用于基于表示构成一首乐曲的旋律的音符串的信息（即，表示旋律的韵律变化的信息；下文中称其为“乐曲信息”）以及表示与各个音符同步地发声的歌词的信息（表示构成歌词的音素串的信息，下文中称其为“歌词信息”）来对歌唱语音进行电子合成（例如，参见WO2007/010680，日本专利申请公开第2005-181840号以及日本专利申请公开第2002-268664号）。近年来，用于使得诸如个人计算机之类的一般计算机执行这样的声乐合成的应用软件得到广泛普及。这种应用软件的示例包括一组声乐合成程序以及存储与从语音表演者或歌手的语音中提取的各种音素相关的各条波形数据的用于声乐合成的数据库。

声乐合成程序是这样一种程序，其用于使得计算机执行如下处理：从用于声乐合成的数据库读取与由歌词信息指定的音素相关的波形数据，对各波形数据进行音高转换以实现由乐曲信息指定的音高，以及按发音顺序组合各波形数据，以生成表示歌唱语音的声音波形的波形数据。另外，在一些声乐合成程序中，不仅可以精细地指定构成在进行歌词发音时所展现的歌词和音高的音素串，而且还可以精细地指定表示诸如在进行歌词发音时所展现的速度和音量之类的语音的发声方式的各种参数，以便获得接近人类歌唱语音的自然歌唱语音。

发明内容

当记录歌手的歌唱语音以制作CD等时，该记录可以包括使歌手重复歌唱直到录音师等满意为止以再次记录歌唱语音的全部或部分的“重录”。在这样的重录中，录音师等通过指定要重录的时间区间（下文中，称其为“重录区间”）和针对该重录区间的歌唱方式（例如，“更轻柔地”或“清楚地吐字”）来指示歌手再次歌唱，同时歌手通过反复试验再次歌唱以便实现录音师等指定的歌唱方式。

此外，在声乐合成中，自然优选的是以声乐合成程序的用户期望的歌唱方式对歌唱语音进行合成。在声乐合成中，通过编辑定义发声方式的各种参数中的每一个，可以按与在人歌唱的情况下所进行的重录中的方式相同的方式来改变合成歌唱语音的歌唱方式。然而，从一般用户的角度来看，他/她经常不知道如何编辑哪个参数来实现诸如“更轻柔地”的歌唱方式并且几乎不能实现期望的歌唱方式。基于表示要合成的语音的韵律变化的信息（与在声乐合成中所使用的乐曲信息相对应的信息）和表示要发声的内容的信息（与在声乐合成中所使用的歌词信息相对应的信息）对除了歌唱语音外的语音（诸如，针对于文学作品的朗读语音或针对各种指导的指导语音）进行电子合成的情况也是如此。在以下描述中，再次进行语音合成以在语音合成中实现期望的发声方式（在声乐合成的情况下，为歌唱方式）也被称为“重录”。

鉴于上述问题做出了本发明的一个或多个实施例，并且本发明的一个目的在于提供一种能够在不直接编辑表示语音的发声方式的各种参数的情况下进行合成语音的重录的技术。

（1）一种语音合成装置包括：序列数据生成单元，其被配置为生成序列数据，该序列数据包括用于控制要基于乐曲信息和歌词信息合成的语音的发声的多种参数；输出单元，其被配置为基于序列数据输出歌唱语音；以及处理内容信息获取单元，其被配置为获取多条处理内容信息。该多条处理内容信息与各条预设的歌唱方式信息相关联。该多条处理内容信息表示用于多种参数的全部或部分的编辑处理的内容。序列数据生成单元生成多条序列数据。通过基于与用户指定的一条歌唱方式信息相关联的多条处理内容信息编辑序列数据中所包括的多种参数的全部或部分，来获得多条序列数据中的每一条。

（2）在根据（1）的语音合成装置中，输出单元基于多条序列数据顺序地输出歌唱语音。

（3）在根据（1）的语音合成装置中，序列数据生成单元还生成多条序列数据。通过基于与用户指定的一条歌唱方式信息相关联的多条处理内容信息的全部或部分的组合编辑序列数据中所包括的多种参数的全部或部分，来获得多条序列数据中的每一条。

（4）在根据（2）的语音合成装置中，多条处理内容信息中的每一条还与表示输出单元输出歌唱语音的优先级的优先级信息相关联。输出单元根据优先级、基于所生成的多条序列数据来顺序地输出歌唱语音。

（5）在根据（4）的语音合成装置中，基于用户输入的对于编辑后的序列数据的评价值来更新优先级。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于雅马哈株式会社，未经雅马哈株式会社许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201410098488.6/2.html，转载请声明来源钻瓜专利网。

上一篇：用于钢水脱硫的合金及其在RH精炼过程的使用方法
下一篇：油水气三相微量润滑系统专用微量润滑剂及其制备方法

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L13-00 语音合成；文本-语音合成系统
G10L13-02 .产生合成语音的方法；语音合成设备
G10L13-06 .语音合成设备中使用的基本语音单位；级联规则
G10L13-08 .文本分析或文本以外的语音合成参数的产生，例如语义图翻译为音素、韵律产生、重音或声调测定
G10L13-04 ..语音合成系统的零部件，例如合成设备结构或存储器管理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]语音合成装置和方法以及存储有语音合成程序的记录介质在审

专利文献下载