[发明专利]生成高质量话音的系统和方法有效
申请号: | 200810003761.7 | 申请日: | 2008-01-22 |
公开(公告)号: | CN101236743A | 公开(公告)日: | 2008-08-06 |
发明(设计)人: | 立花隆辉;长野彻;西村雅史 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G10L13/02 | 分类号: | G10L13/02;G10L13/04;G06F17/00 |
代理公司: | 北京市柳沈律师事务所 | 代理人: | 黄小临 |
地址: | 美国纽*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 提供一种系统包括:音素段存储部分,存储多个音素段数据块;合成部分,通过从音素段存储部分读取与代表输入文本的发音的各个音素对应的音素段数据块、然后将音素段数据块彼此相连,来生成代表文本的合成话音的语音数据;计算部分,根据语音数据来计算指示代表文本的合成话音的语音数据的不自然度的得分;意译存储部分,存储作为多个第一注释的意译的多个第二注释,并将第二注释与各个第一注释关联;替换部分,搜索文本以找到与任何第一注释相匹配的注释,并用与第一注释对应的第二注释来替换搜索到的注释;以及判断部分,在计算出的得分小于参考值的情况下,输出所生成的语音数据,并将替换后文本输入到合成部分中,以使合成部分进一步生成用于该文本的语音数据。 | ||
搜索关键词: | 生成 质量 话音 系统 方法 | ||
【主权项】:
1.一种用于生成合成话音的系统,该系统包括:音素段存储部分,用于存储指示彼此不同的音素的声音的多个音素段数据块;合成部分,用于通过接收输入文本、读取与指示所述输入文本的发音的各个音素对应的音素段数据块、然后将读出的音素段数据块彼此相连,来生成代表所述文本的合成话音的语音数据;计算部分,用于根据所述语音数据来计算指示所述文本的合成话音的不自然度的得分;意译存储部分,用于存储作为多个第一注释的意译的多个第二注释,并将所述第二注释与各个所述第一注释关联;替换部分,用于搜索所述文本以找到与任何所述第一注释相匹配的注释,并用与所述第一注释对应的所述第二注释来替换搜索到的注释;以及判断部分,用于在计算出的得分小于预定的参考值的情况下,输出所生成的语音数据,并在所述得分等于或大于所述参考值的情况下,将所述文本输入到所述合成部分中,以便使所述合成部分进一步生成用于替换后文本的语音数据。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200810003761.7/,转载请声明来源钻瓜专利网。
- 上一篇:阴阳轮平衡无级变速器
- 下一篇:一种加热炉激光检测器安装支架