[发明专利]韵律结构预测方法和装置有效
申请号: | 201510324535.9 | 申请日: | 2015-06-12 |
公开(公告)号: | CN104867490B | 公开(公告)日: | 2017-03-22 |
发明(设计)人: | 陈志杰;李秀林 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G10L13/10 | 分类号: | G10L13/10;G10L15/08;G06F17/30 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙)11201 | 代理人: | 宋合成 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 韵律 结构 预测 方法 装置 | ||
技术领域
本发明涉及语音合成技术领域,尤其涉及一种韵律结构预测方法和装置。
背景技术
韵律结构预测技术是语音合成技术的核心,韵律结构预测的准确与否,直接影响到语音合成系统后端的声学建模部分,由此可见,韵律结构预测在语音合成系统中的重要地位。
现有的韵律结构预测模型主要是利用监督学习的方法来训练得到的,为了使得韵律结构预测模型达到较好的性能,往往需要大量人工标注的训练数据。由于韵律结构预测问题属于自然语言处理(Natural Language Processing;以下简称:NLP)中的结构化预测问题,而结构化预测问题的训练数据又很难获得,并且还存在标注一致性的问题,因此,基于监督学习方法的韵律结构预测模型的性能往往受制于训练数据的数量以及质量,这主要体现在训练数据的稀疏性和歧义性这两个方面,经常导致基于监督学习方法的韵律结构预测模型无法正确预测出句子或句子中的词语的韵律结构。
发明内容
本发明的目的旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本发明的第一个目的在于提出一种韵律结构预测方法。该方法在训练获得韵律结构预测模型时,引入了词向量的聚类特征,提升了韵律结构预测模型的性能,进而可以提升语音合成的效果。
本发明的第二个目的在于提出一种韵律结构预测装置。
为了实现上述目的,本发明第一方面实施例的韵律结构预测方法,包括:对无标注数据进行学习获得词语的词向量;对所述词语的词向量进行聚类,获得所述词向量的聚类特征;将所述聚类特征加入从标注数据提取的特征集合中;对加入所述聚类特征的特征集合进行训练获得带有聚类特征的韵律结构预测模型;通过所述韵律结构预测模型进行韵律结构预测。
本发明实施例的韵律结构预测方法,对无标注数据进行学习获得词语的词向量,然后对上述词语的词向量进行聚类,获得上述词向量的聚类特征,再将上述词向量的聚类特征加入从标注数据提取的特征集合中,最后对加入上述聚类特征的特征集合进行训练获得带有聚类特征的韵律结构预测模型,从而在训练获得韵律结构预测模型时,引入了词向量的聚类特征,提升了韵律结构预测模型的性能,然后通过上述韵律结构预测模型进行韵律结构预测,进而可以提升语音合成的效果。
为了实现上述目的,本发明第二方面实施例的韵律结构预测装置,包括:学习模块,用于对无标注数据进行学习获得词语的词向量;聚类模块,用于对所述学习模块获得的所述词语的词向量进行聚类,获得所述词向量的聚类特征;添加模块,用于将所述聚类模块获得的所述词向量的聚类特征加入从标注数据提取的特征集合中;训练模块,用于对加入所述聚类特征的特征集合进行训练获得带有聚类特征的韵律结构预测模型;预测模块,用于通过所述训练模块获得的韵律结构预测模型进行韵律结构预测。
本发明实施例的韵律结构预测装置中,学习模块对无标注数据进行学习获得词语的词向量,然后聚类模块对上述词语的词向量进行聚类,获得上述词向量的聚类特征,再由添加模块将上述词向量的聚类特征加入从标注数据提取的特征集合中,最后训练模块对加入上述聚类特征的特征集合进行训练获得带有聚类特征的韵律结构预测模型,从而在训练获得韵律结构预测模型时,引入了词向量的聚类特征,提升了韵律结构预测模型的性能,然后预测模块通过上述韵律结构预测模型进行韵律结构预测,进而可以提升语音合成的效果。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本发明韵律结构预测方法一个实施例的流程图;
图2为本发明韵律结构预测方法中韵律结构预测模型的架构一个实施例的示意图;
图3为本发明韵律结构预测方法中进行了聚类特征提取后的训练语料的示意图;
图4为本发明采用改进后的韵律结构预测模型的语音合成系统一个实施例的示意图;
图5为本发明韵律结构预测装置一个实施例的结构示意图;
图6为本发明韵律结构预测装置另一个实施例的结构示意图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510324535.9/2.html,转载请声明来源钻瓜专利网。