[发明专利]一种哼唱合成方法和系统无效
申请号: | 201010223497.5 | 申请日: | 2010-06-30 |
公开(公告)号: | CN101901598A | 公开(公告)日: | 2010-12-01 |
发明(设计)人: | 李健;张连毅;武卫东 | 申请(专利权)人: | 北京捷通华声语音技术有限公司 |
主分类号: | G10L13/02 | 分类号: | G10L13/02;G10L13/08 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 苏培华 |
地址: | 100193 北京市海淀区东北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 哼唱 合成 方法 系统 | ||
技术领域
本发明涉及语音合成技术领域,特别是涉及一种哼唱合成方法和系统。
背景技术
语音合成技术,又称文语转换(TTS,Text to Speech)技术,其能将任意文字信息转化为标准流畅的语音朗读出来。
目前的语音合成方法是预先录制一个语音库,然后在该语音库基础上完成一个语音合成系统。此方法合成声音的语调节奏取决于语音库,即合成出的声音像是录音人在说话。
而在一些娱乐应用中,用户希望可以调节合成语音的语调节奏,比如,将短信以歌曲的语调“唱”出来。
总之,需要本领域技术人员迫切解决的一个技术问题就是:如何能够合成具有歌曲语调节奏的语音。
发明内容
本发明所要解决的技术问题是提供一种哼唱合成方法和系统,用于输出带有歌曲节奏和旋律的语音数据。
为了解决上述问题,本发明公开了一种哼唱合成方法,包括:
接收用户输入的文本;
进行文本分析,获得与所述文本对应的音节序列,以及,该音节序列中每个音节的音节名称;
针对所述音节序列中每个音节,根据其音节名称及上下文环境,结合统计参数模型,规划得到相应的时长参数、基频参数和谱参数;
依据用户选择的歌曲模板和所述音节序列的音节个数,对所述规划得到的时长参数、基频参数进行调整,其中,所述歌曲模板中存储有音节的时长参数和基频参数;
依据调整后的时长参数,对相应音节的谱参数进行插值调整;
根据所述音节序列中每个音节的时长参数、基频参数和谱参数,利用合成器得到与所述音节序列对应的语音数据。
优选的,所述对时长参数、基频参数进行调整的步骤,包括:
获取所述音节序列的音节个数;
从所述歌曲模板中提取与所述音节个数相应的时长参数和基频参数,并覆盖所述规划得到的时长参数、基频参数。
优选的,所述文本分析步骤包括:
对所述文本进行分词操作;
将所述文本中的数字符号转换为文字;
依据分词结果,对数字符号转换后的文本进行韵律预测;
根据韵律预测结果,将文本转换为音节序列,以及,基于音节映射表,得到该音节序列中每个音节的音节名称。
优选的,所述歌曲模板为通过如下步骤生成的模板:
针对歌曲样本,提取其中每个音节的时长参数和基频参数;
将所述时长参数和基频参数,保存至歌曲模板。
优选的,所述歌曲样本包括清唱歌曲样本。
另一方面,本发明还公开了一种哼唱合成系统,包括:
接口模块,用于接收用户输入的文本;
文本分析模块,用于进行文本分析,获得与所述文本对应的音节序列,以及,该音节序列中每个音节的音节名称;
参数规划模块,用于针对所述音节序列中每个音节,根据其音节名称及上下文环境,结合统计参数模型,规划得到相应的时长参数、基频参数和谱参数;
第一参数调整模块,用于依据用户选择的歌曲模板和所述音节序列的音节个数,对所述规划得到的时长参数、基频参数进行调整,其中,所述歌曲模板中存储有音节的时长参数和基频参数;
第二参数调整模块,用于依据调整后的时长参数,对相应音节的谱参数进行插值调整;
合成模块,用于根据所述音节序列中每个音节的时长参数、基频参数和谱参数,利用合成器得到与所述音节序列对应的语音数据。
优选的,所述第一参数调整模块包括:
获取单元,用于获取所述音节序列的音节个数;
调整单元,用于从歌曲模板中提取与所述音节个数对应的参数信息,覆盖所述规划得到的时长参数、基频参数,并对谱参数依据规划时长进行插值。
优选的,所述文本分析模块包括:
分词单元,用于对所述文本进行分词操作;
数字符号转换单元,用于将所述文本中的数字符号转换为文字;
韵律预测单元,用于依据分词结果,对数字符号转换后的文本进行韵律预测;
音节转换单元,用于根据韵律预测结果,将文本转换为音节序列,以及,基于音节映射表,得到该音节序列中每个音节的音节名称。
优选的,所述系统还包括歌曲模板生成模块,该歌曲模板生成模块包括:
提取单元,用于针对歌曲样本,提取其中每个音节的时长参数和基频参数;
保存单元,用于将所述时长参数和基频参数,保存至歌曲模板。
优选的,所述歌曲样本包括清唱歌曲样本。
与现有技术相比,本发明具有以下优点:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京捷通华声语音技术有限公司,未经北京捷通华声语音技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010223497.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:低烟无卤阻燃综合屏蔽地铁轻轨信号电缆
- 下一篇:电解质形成液体电流的演示装置