[发明专利]用于将文本转换成语音的方法和系统有效

申请号：	201010580334.2	申请日：	2010-11-30
公开（公告）号：	CN102479508A	公开（公告）日：	2012-05-30
发明（设计）人：	刘盈;付国康;韩兆兵;贾宾	申请（专利权）人：	国际商业机器公司
主分类号：	G10L13/08	分类号：	G10L13/08;G10L13/04;G10L15/18
代理公司：	北京市金杜律师事务所 11256	代理人：	吴立明;黄耀钧
地址：	美国纽***	国省代码：	美国;US
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	用于文本转换成语方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及信息技术领域，更具体地，本发明涉及用于将文本转换成语音的方法和系统。

背景技术

直到现在，LVCSR(大词汇量连续语音识别)和NLU(自然语言处理)仍然不能满足现实生活中人机语音通信的正确性和性能要求。

因此，在支持语音的应用中，例如在基于Web页面的语音控制应用中，如果数据源内容发生了变化，必须根据数据源内容动态地产生语法。

在语音识别过程中，如何降低计算复杂度，提高识别效率，是一个需要面对的问题。

发明内容

根据本发明的第一方面，提出了一种将文本转换成语音的方法，包括对以文本形式的数据源进行解析，以获得数据源的部分词条列表；对各个部分词条列表分别进行编译，以获得与各个部分词条列表相对应的各个音素图；对获得的各个音素图进行合并；以及根据合并结果，进行语音识别。

根据本发明的第二方面，提出了一种将文本转换成语音的系统，包括：数据解析器，用于对以文本形式的数据源进行解析，以获得数据源的部分词条列表；一个或多个编译器，用于对各个部分词条列表分别进行编译，以获得与各个部分词条列表相对应的各个音素图；合并器，用于对获得的各个音素图进行合并；以及语音识别器，用于根据合并结果，进行语音识别。

根据本发明，可以在语音识别过程中降低计算复杂度，提高识别效率。

附图说明

通过以下结合附图的说明，并且随着对本发明的更全面了解，本发明的其他目的和效果将变得更加清楚和易于理解，其中：

图1示出了根据本发明的第一实施方式的用于将文本转化成语音的系统；

图2示出了根据本发明的第二实施方式的用于将文本转化成语音的系统；

图3示出了根据本发明的第三实施方式的用于将文本转化成语音的方法的流程图；

图4示出了根据本发明的第四实施方式的用于将文本转化成语音的方法的流程图；

图5示出了根据本发明的将文本转化成语音的具体例子；

在所有的上述附图中，相同的标号表示具有相同、相似或相应的特征或功能。

具体实施方式

以下结合附图对本发明的具体实施方式进行描述。

本发明的基本思想是通过并行地或串行地解析以文本形式的数据源，获得数据源的部分词条列表。然后对各个部分词条列表分别进行编译，以获得与各个部分词条列表相对应的各个音素图。然后合并获得的各个音素图。然后，根据合并结果，进行语音识别处理。

图1示出了根据本发明的第一实施方式的用于将文本转化成语音的系统。

如图1所示，该系统100包括数据解析器110，用于对以文本形式的数据源进行解析，以获得数据源的部分词条列表；多个编译器120-1、120-2、120-3、...、120-N-1、120-N，用于对各个部分词条列表分别进行编译，以获得与各个部分词条列表相对应的各个音素图；合并器130，用于合并获得的各个音素图；语音识别器140，用于根据合并结果，进行语音识别。

本领域的技术人员应当理解，在这里，词条代表字、词、短语等常见的语法元素。部分词条列表是指解析整个数据源应该得到的词条列表的一部分。

在该第一实施方式中，数据解析器110串行地解析所述数据源，在获得数据源的一个部分词条列表后，就调用一个编译器(例如编译器120-1)对该部分词条列表进行编译，以获得一个音素图，然后继续对剩下的数据源进行解析，以获得下一个部分词条列表。

在该第一实施方式中，还包括判断器160，用于判断合并结果是否有足够的信息可以进行语音识别。其中如果有足够的信息，例如，如果有完整的一个句子，语音识别器140就开始进行语音识别。

在该第一实施方式中，在合并器130完成获得的各个音素图的合并之前，在当前数据源发生了变化的情况下，合并器130继续进行对获得的各个音素图的合并，并缓存合并结果。

在该第一实施方式中，还可以包括优化器150，用于对合并结果进行优化。例如，优化器150对合并结果中相同的节点进行合并，如下面所描述的。

在该第一实施方式中，编译器120-1、120-2、120-3、...、120-N-1、120-N中的每一个编译器120可以包括：语法获得器1201，用于对部分词条列表应用语法模板，以获得与部分词条列表相对应的语法；确定器1202，用于确定语法的音素列表；创建器1203，用于根据所述音素列表，创建相对应的音素树；优化器1204，用于对音素树进行优化，以获得相对应的音素图。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于国际商业机器公司，未经国际商业机器公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201010580334.2/2.html，转载请声明来源钻瓜专利网。

上一篇：存储系统
下一篇：一种治疗原发性高血压的中药组合物的制备方法

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L13-00 语音合成；文本-语音合成系统
G10L13-02 .产生合成语音的方法；语音合成设备
G10L13-06 .语音合成设备中使用的基本语音单位；级联规则
G10L13-08 .文本分析或文本以外的语音合成参数的产生，例如语义图翻译为音素、韵律产生、重音或声调测定
G10L13-04 ..语音合成系统的零部件，例如合成设备结构或存储器管理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]用于将文本转换成语音的方法和系统有效

专利文献下载