[发明专利]混合型语音合成系统无效
申请号: | 200910030596.9 | 申请日: | 2009-04-24 |
公开(公告)号: | CN101872614A | 公开(公告)日: | 2010-10-27 |
发明(设计)人: | 韩松 | 申请(专利权)人: | 韩松 |
主分类号: | G10L13/02 | 分类号: | G10L13/02 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 210008 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 混合 语音 合成 系统 | ||
技术领域
本发明涉及一种语音合成系统,尤其是一种混合型语音合成系统。
背景技术
语音合成是计算机技术领域中的一个分支,主要功能是把一个给定的输入文本,通过计算机程序,自动转化为语音数据,随后可由输出设备如扬声器或耳机等输出。不同的自然语音的语音合成方法一般各不相同。混合型语音合成系统是语音合成系统的一类,它包括一个合成引擎和一个预先录入的语音数据库,合成引擎通过计算机软件查找语音数据库中匹配的读音把文本转化为语音。但是,通过这种系统计算机所发出的语音不连续,输出的语音不流畅、不自然。
发明内容
为解决上述技术问题,本发明提出一种混合型语音合成系统,包括语音库、语音合成引擎,所述语音库为混合型语音库,包括综合录入的真人发音和计算机处理的非真人发音,其语音库中词语与句子为真人发音,单个字词为非真人发音。
所述混合型语音库制作过程包括以下步骤:
A.对语音数据进行统计,分析单个字、词或句子可能出现的所有发音,这一步骤必须具备完备性,即所收集和统计的数据必须覆盖一种自然语言的全部;
B.对字、词、句子的可能发音进行录音,根据适用的目标应用程序的要求,进行有损或无损压缩,编译成二进制文件,另外创建索引信息,应用计算机程序根据一个字、词或句子查找到语音的二进制文件;
C.搜集语言的材料库,分析字词句发音的例外情况,对于例外情况,建立规则集,所述规则集对于给定的字词以及所处的上下文信息,准确地给出最佳的发音;
D.把语音库,规则集压缩创建索引,生成混合型语音库。所述语音合成引擎核心功能是把输入的文本转换为语音,转换过程包括以下步骤:
A.对输入的自然语音文本进行分析,该分析过程包括:语句的切分,寻找切分最理想的粒度,分析语句中可能出现的特殊情况,对于有多种发音可能或者可能动态改变发音的情况,要把待发音的字、词句以及上下文的情况进行编码,生成一个可以被上下文中提及的规则集识别的输入情况;
B.对切分好的字、词、句或段落,查找语音库或者规则集,按索引获取语音信息;
C.合成,优化处理并输出。
由于本发明所述语音库为混合型语音库,包括综合录入的真人发音和计算机处理的非真人发音,语音库中词语与句子为真人发音,真人发音具有语言流畅、清楚、连续的优点,因此非常适用以下领域(不限于所列):
1、无线平台的语音合成。比如智能手机,手持电子设备平台。这些平台通常只有有限的存储空间。在这些平台上的带有语音的应用程序可以使用本语音合成系统,达到节省存储空间,提高合成质量的目的。
2、导航系统。GPS和车载导航系统需要高质量的语音导航,在需要的时候对驾驶员做出提示。这是本系统一个非常理想的应用场合。此外,任何需要对操作人员进行语音提示或指令,而需要尽量少分散操作元注意力的应用场合,均可使用本语音合成系统。
3、公共场合的广播系统。目前广播系统大多使用人工广播,既浪费人力资源,也容易出错,而广播的内容,往往是程序输出的结果(比如车站机场的提示信息,均是调度软件系统的输出数据)。如果把这些结果数据直接输入到本语音合成系统中,可以降低人员成本,而且不必担心认为因素导致的错误。
有益效果
与传统的文字到语音的自动合成技术对比,本发明具有以下优点:
1、合成结果效果好,语音连续,输出的语言流畅、自然。经过本系统合成的语音,可以达到真人发音的效果;
2、体积小。本系统自带的语音库,体积通常在5M字节以下,体积小,效率高,适合各种计算平台,包括移动手机平台;
3、语音数据库不随待覆盖文本的大小增大而增大;
具体实施方式
实施例1:
一种混合型语音合成系统,包括语音库、语音合成引擎,所述语音库为混合型语音库,包括综合录入的真人发音和计算机处理的非真人发音,其语音库中词语与句子为真人发音,单个字词为非真人发音。
所述混合型语音库制作过程包括以下步骤:
A、对语音数据进行统计,分析单个字、词或句子可能出现的所有发音,这一步骤必须具备完备性,即所收集和统计的数据必须覆盖一种自然语言的全部;
B、对字、词、句子的可能发音进行录音,根据适用的目标应用程序的要求,进行有损或无损压缩,编译成二进制文件,另外创建索引信息,应用计算机程序根据一个字、词或句子查找到语音的二进制文件;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于韩松,未经韩松许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910030596.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种有机光电器件及其制备方法
- 下一篇:可插入SIM卡的网络文件播放系统