[发明专利]一种哼唱合成方法和系统无效

专利信息
申请号: 201010223497.5 申请日: 2010-06-30
公开(公告)号: CN101901598A 公开(公告)日: 2010-12-01
发明(设计)人: 李健;张连毅;武卫东 申请(专利权)人: 北京捷通华声语音技术有限公司
主分类号: G10L13/02 分类号: G10L13/02;G10L13/08
代理公司: 北京润泽恒知识产权代理有限公司 11319 代理人: 苏培华
地址: 100193 北京市海淀区东北*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 哼唱 合成 方法 系统
【说明书】:

技术领域

发明涉及语音合成技术领域,特别是涉及一种哼唱合成方法和系统。

背景技术

语音合成技术,又称文语转换(TTS,Text to Speech)技术,其能将任意文字信息转化为标准流畅的语音朗读出来。

目前的语音合成方法是预先录制一个语音库,然后在该语音库基础上完成一个语音合成系统。此方法合成声音的语调节奏取决于语音库,即合成出的声音像是录音人在说话。

而在一些娱乐应用中,用户希望可以调节合成语音的语调节奏,比如,将短信以歌曲的语调“唱”出来。

总之,需要本领域技术人员迫切解决的一个技术问题就是:如何能够合成具有歌曲语调节奏的语音。

发明内容

本发明所要解决的技术问题是提供一种哼唱合成方法和系统,用于输出带有歌曲节奏和旋律的语音数据。

为了解决上述问题,本发明公开了一种哼唱合成方法,包括:

接收用户输入的文本;

进行文本分析,获得与所述文本对应的音节序列,以及,该音节序列中每个音节的音节名称;

针对所述音节序列中每个音节,根据其音节名称及上下文环境,结合统计参数模型,规划得到相应的时长参数、基频参数和谱参数;

依据用户选择的歌曲模板和所述音节序列的音节个数,对所述规划得到的时长参数、基频参数进行调整,其中,所述歌曲模板中存储有音节的时长参数和基频参数;

依据调整后的时长参数,对相应音节的谱参数进行插值调整;

根据所述音节序列中每个音节的时长参数、基频参数和谱参数,利用合成器得到与所述音节序列对应的语音数据。

优选的,所述对时长参数、基频参数进行调整的步骤,包括:

获取所述音节序列的音节个数;

从所述歌曲模板中提取与所述音节个数相应的时长参数和基频参数,并覆盖所述规划得到的时长参数、基频参数。

优选的,所述文本分析步骤包括:

对所述文本进行分词操作;

将所述文本中的数字符号转换为文字;

依据分词结果,对数字符号转换后的文本进行韵律预测;

根据韵律预测结果,将文本转换为音节序列,以及,基于音节映射表,得到该音节序列中每个音节的音节名称。

优选的,所述歌曲模板为通过如下步骤生成的模板:

针对歌曲样本,提取其中每个音节的时长参数和基频参数;

将所述时长参数和基频参数,保存至歌曲模板。

优选的,所述歌曲样本包括清唱歌曲样本。

另一方面,本发明还公开了一种哼唱合成系统,包括:

接口模块,用于接收用户输入的文本;

文本分析模块,用于进行文本分析,获得与所述文本对应的音节序列,以及,该音节序列中每个音节的音节名称;

参数规划模块,用于针对所述音节序列中每个音节,根据其音节名称及上下文环境,结合统计参数模型,规划得到相应的时长参数、基频参数和谱参数;

第一参数调整模块,用于依据用户选择的歌曲模板和所述音节序列的音节个数,对所述规划得到的时长参数、基频参数进行调整,其中,所述歌曲模板中存储有音节的时长参数和基频参数;

第二参数调整模块,用于依据调整后的时长参数,对相应音节的谱参数进行插值调整;

合成模块,用于根据所述音节序列中每个音节的时长参数、基频参数和谱参数,利用合成器得到与所述音节序列对应的语音数据。

优选的,所述第一参数调整模块包括:

获取单元,用于获取所述音节序列的音节个数;

调整单元,用于从歌曲模板中提取与所述音节个数对应的参数信息,覆盖所述规划得到的时长参数、基频参数,并对谱参数依据规划时长进行插值。

优选的,所述文本分析模块包括:

分词单元,用于对所述文本进行分词操作;

数字符号转换单元,用于将所述文本中的数字符号转换为文字;

韵律预测单元,用于依据分词结果,对数字符号转换后的文本进行韵律预测;

音节转换单元,用于根据韵律预测结果,将文本转换为音节序列,以及,基于音节映射表,得到该音节序列中每个音节的音节名称。

优选的,所述系统还包括歌曲模板生成模块,该歌曲模板生成模块包括:

提取单元,用于针对歌曲样本,提取其中每个音节的时长参数和基频参数;

保存单元,用于将所述时长参数和基频参数,保存至歌曲模板。

优选的,所述歌曲样本包括清唱歌曲样本。

与现有技术相比,本发明具有以下优点:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京捷通华声语音技术有限公司,未经北京捷通华声语音技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201010223497.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top