[发明专利]一种哼唱合成方法和系统无效

申请号：	201010223497.5	申请日：	2010-06-30
公开（公告）号：	CN101901598A	公开（公告）日：	2010-12-01
发明（设计）人：	李健;张连毅;武卫东	申请（专利权）人：	北京捷通华声语音技术有限公司
主分类号：	G10L13/02	分类号：	G10L13/02;G10L13/08
代理公司：	北京润泽恒知识产权代理有限公司 11319	代理人：	苏培华
地址：	100193 北京市海淀区东北***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种哼唱合成方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及语音合成技术领域，特别是涉及一种哼唱合成方法和系统。

背景技术

语音合成技术，又称文语转换(TTS，Text to Speech)技术，其能将任意文字信息转化为标准流畅的语音朗读出来。

目前的语音合成方法是预先录制一个语音库，然后在该语音库基础上完成一个语音合成系统。此方法合成声音的语调节奏取决于语音库，即合成出的声音像是录音人在说话。

而在一些娱乐应用中，用户希望可以调节合成语音的语调节奏，比如，将短信以歌曲的语调“唱”出来。

总之，需要本领域技术人员迫切解决的一个技术问题就是：如何能够合成具有歌曲语调节奏的语音。

发明内容

本发明所要解决的技术问题是提供一种哼唱合成方法和系统，用于输出带有歌曲节奏和旋律的语音数据。

为了解决上述问题，本发明公开了一种哼唱合成方法，包括：

接收用户输入的文本；

进行文本分析，获得与所述文本对应的音节序列，以及，该音节序列中每个音节的音节名称；

针对所述音节序列中每个音节，根据其音节名称及上下文环境，结合统计参数模型，规划得到相应的时长参数、基频参数和谱参数；

依据用户选择的歌曲模板和所述音节序列的音节个数，对所述规划得到的时长参数、基频参数进行调整，其中，所述歌曲模板中存储有音节的时长参数和基频参数；

依据调整后的时长参数，对相应音节的谱参数进行插值调整；

根据所述音节序列中每个音节的时长参数、基频参数和谱参数，利用合成器得到与所述音节序列对应的语音数据。

优选的，所述对时长参数、基频参数进行调整的步骤，包括：

获取所述音节序列的音节个数；

从所述歌曲模板中提取与所述音节个数相应的时长参数和基频参数，并覆盖所述规划得到的时长参数、基频参数。

优选的，所述文本分析步骤包括：

对所述文本进行分词操作；

将所述文本中的数字符号转换为文字；

依据分词结果，对数字符号转换后的文本进行韵律预测；

根据韵律预测结果，将文本转换为音节序列，以及，基于音节映射表，得到该音节序列中每个音节的音节名称。

优选的，所述歌曲模板为通过如下步骤生成的模板：

针对歌曲样本，提取其中每个音节的时长参数和基频参数；

将所述时长参数和基频参数，保存至歌曲模板。

优选的，所述歌曲样本包括清唱歌曲样本。

另一方面，本发明还公开了一种哼唱合成系统，包括：

接口模块，用于接收用户输入的文本；

文本分析模块，用于进行文本分析，获得与所述文本对应的音节序列，以及，该音节序列中每个音节的音节名称；

参数规划模块，用于针对所述音节序列中每个音节，根据其音节名称及上下文环境，结合统计参数模型，规划得到相应的时长参数、基频参数和谱参数；

第一参数调整模块，用于依据用户选择的歌曲模板和所述音节序列的音节个数，对所述规划得到的时长参数、基频参数进行调整，其中，所述歌曲模板中存储有音节的时长参数和基频参数；

第二参数调整模块，用于依据调整后的时长参数，对相应音节的谱参数进行插值调整；

合成模块，用于根据所述音节序列中每个音节的时长参数、基频参数和谱参数，利用合成器得到与所述音节序列对应的语音数据。

优选的，所述第一参数调整模块包括：

获取单元，用于获取所述音节序列的音节个数；

调整单元，用于从歌曲模板中提取与所述音节个数对应的参数信息，覆盖所述规划得到的时长参数、基频参数，并对谱参数依据规划时长进行插值。

优选的，所述文本分析模块包括：

分词单元，用于对所述文本进行分词操作；

数字符号转换单元，用于将所述文本中的数字符号转换为文字；

韵律预测单元，用于依据分词结果，对数字符号转换后的文本进行韵律预测；

音节转换单元，用于根据韵律预测结果，将文本转换为音节序列，以及，基于音节映射表，得到该音节序列中每个音节的音节名称。

优选的，所述系统还包括歌曲模板生成模块，该歌曲模板生成模块包括：

提取单元，用于针对歌曲样本，提取其中每个音节的时长参数和基频参数；

保存单元，用于将所述时长参数和基频参数，保存至歌曲模板。

优选的，所述歌曲样本包括清唱歌曲样本。

与现有技术相比，本发明具有以下优点：

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京捷通华声语音技术有限公司，未经北京捷通华声语音技术有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201010223497.5/2.html，转载请声明来源钻瓜专利网。

上一篇：低烟无卤阻燃综合屏蔽地铁轻轨信号电缆
下一篇：电解质形成液体电流的演示装置

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L13-00 语音合成；文本-语音合成系统
G10L13-02 .产生合成语音的方法；语音合成设备
G10L13-06 .语音合成设备中使用的基本语音单位；级联规则
G10L13-08 .文本分析或文本以外的语音合成参数的产生，例如语义图翻译为音素、韵律产生、重音或声调测定
G10L13-04 ..语音合成系统的零部件，例如合成设备结构或存储器管理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种哼唱合成方法和系统无效

专利文献下载