[发明专利]韵律短语预测方法有效
申请号: | 201010294552.X | 申请日: | 2010-09-27 |
公开(公告)号: | CN102063898A | 公开(公告)日: | 2011-05-18 |
发明(设计)人: | 李健;张连毅;武卫东 | 申请(专利权)人: | 北京捷通华声语音技术有限公司 |
主分类号: | G10L13/08 | 分类号: | G10L13/08;G10L15/04 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 苏培华 |
地址: | 100193 北京市海淀区东北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 韵律 短语 预测 方法 | ||
技术领域
本发明涉及一种语音合成技术领域,特别是涉及一种韵律短语预测方法。
背景技术
随着技术的发展,语音合成技术已经越来越多的受到人们的关注。现阶段合成语音的可懂度已经达到相当高的水平,但自然度还不够高,韵律层次预测的不准确。
由于现有的语音合成系统大多只能生成固定语调模式的语句,对语句中的停顿、轻重、长短、速度及升降调等出现不当处理,使合成语音听起来枯燥、呆板。韵律生成的主要障碍在于确定韵律的层次,常见的韵律层次是把韵律结构自下而上划分为韵律词、次韵律短语、主韵律短语和呼吸群。近年来,越来越多的研究都集中于预测韵律结构。多通过首先设计或收集一个标注好的语料数据库,然后用某种学习算法建立一个训练模型,并用从数据库中提取出的语法和韵律特征参数对模型进行训练,从而得到最终的韵律预测模型。
然而,因为汉语语言结构非常复杂,采用目前常见韵律预测模型对于韵律短语边界预测的正确率并不高,阻碍了自然度的进一步提高。
发明内容
本发明所要解决的技术问题是提供一种韵律短语预测方法,能够提高韵律短语边界预测的准确性。
为了解决上述问题,本发明公开了一种韵律短语预测方法,包括:最大熵模型预测,分析句子的特征,并对韵律短语进行预测;语法边界预测,分析句子的特征,根据语法规则对语法边界进行预测;对最大熵模型预测结果进行调整,通过预测出的语法边界,对最大熵模型预测结果进行调整,并根据调整后的概率结果确定韵律短语边界。
进一步地,该方法中,对最大熵模型预测结果的调整包括将最大熵模型预测结果中语法边界处是韵律短语边界的概率增大,非语法边界处是韵律短语边界的概率降低。
进一步地,该最大熵模型预测之前还包括建立最大熵模型,建立最大熵模型包括选择最大熵模型特征、准备训练数据及最大熵模型训练。
进一步地,该最大熵模型预测包括解析出句子中分词边界等特征,并根据确定的特征进行标注,然后将标注后的数据送入最大熵模型进行预测,得出词与词之间是否为韵律短语边界的概率。
进一步地,该最大熵模型解析出的特征包括前一词的词性、词长,后一词的词性、词长或者词性与词长的组合。
进一步地,该语法边界预测之前还包括总结语法规则,并根据语法规则确定句子中的短语在句中的成分及句子的结构。
进一步地,该语法规则的总结根据汉语结构特点进行。
进一步地,该语法边界预测还包括根据总结的语法规则将句子进行短语划分,并解析为多个短语组合的形式,然后根据句子的语法结构规则,分析出语法边界。
与现有技术相比,本发明具有以下优点:
本发明的韵律短语预测方法中首先采用最大熵模型对韵律短语进行预测,然后对句子进行成分分析,得出语法短语边界,如主谓边界、谓宾边界等。然后通过这些语法短语边界对最大熵模型的预测结果进行调整。将语法短语边界处是韵律短语边界的概率增大,将非语法短语边界处是韵律短语边界的概率减小。因为韵律短语边界一定是语法短语边界,而语法短语边界不一定是韵律短语边界,因此提高了韵律短语预测的准确性。
附图说明
图1是本发明实施例的韵律短语预测方法的流程图。
图2是图1所示韵律短语预测方法中的语法规则分析的流程图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
请参阅图1,本发明的韵律短语预测方法首先采用最大熵模型对韵律短语边界进行预测;然后对句子进行成分分析,得出语法短语边界,如主谓边界、谓宾边界等。然后通过这些语法短语边界对最大熵模型的预测结果进行调整。将语法短语边界处是韵律短语边界的概率增大,将非语法短语边界处是韵律短语边界的概率减小。因为韵律短语边界一定是语法短语边界,而语法短语边界不一定是韵律短语边界,故若最大熵模型预测出的韵律短语边界不在语法短语边界上,则预测错误的可能性就比较大。下面对本发明的韵律短语预测方法进行详细说明。
在预测之前还包括建立最大熵模型及总结语法规则。其中,建立最大熵模型包括:
(1)选择最大熵模型特征
选择与韵律短语位置有关的特征作为最大熵模型的特征,例如,前一词的词性、词长,后一词的词性、词长,或者前一词的词性与词长的组合。
(2)准备训练数据
在选择最大熵模型的特征之后,进行训练数据的准备,需要确定模型中分词边界的特征。如前一词的词性、词长,后一词的词性、词长等等,即上述模型中的x。然后进行数据准备,准备一些语料,并根据确定的特征进行标注。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京捷通华声语音技术有限公司,未经北京捷通华声语音技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010294552.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:卤素化合物、多环系化合物及使用其的有机电致发光元件
- 下一篇:影像显示装置