[发明专利]一种融合句法语义语用信息的汉语韵律结构预测方法有效

专利信息
申请号: 201810200521.X 申请日: 2018-03-12
公开(公告)号: CN108470024B 公开(公告)日: 2020-10-30
发明(设计)人: 高懿;季竞;张志平;陈博 申请(专利权)人: 北京灵伴即时智能科技有限公司
主分类号: G06F40/211 分类号: G06F40/211;G06F40/30;G10L15/18
代理公司: 暂无信息 代理人: 暂无信息
地址: 100083 北京市*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 融合 句法 语义 信息 汉语 韵律 结构 预测 方法
【说明书】:

本发明属于语音合成领域,具体涉及一种融合句法语义语用信息的汉语韵律结构预测方法。目的是通过对影响韵律结构的多维特征及其相关作用模式的分析,将句法语义语用信息融合到韵律结构预测模型中,进而提升语音合成的自然度。该方法包括根据语义角色标注进行句块划分;对句块进行语法分析,并标记语法结构关系松紧度;对韵律结构进行初步切分;对句子中的名词性成分的信息结构进行标记;对语用信息进行标注;根据语用信息对初步切分的韵律结构进行调整。本发明在文本标注体系中引入了深层句法、语义角色标注以及语用信息,并通过统计与规则相结合的方式实现文本标注、特征提取以及韵律结构预测,使韵律预测模型准确性得到有效提高。

技术领域

本发明属于语音合成领域,具体涉及一种融合句法语义语用信息的汉语韵律结构预测方法。

背景技术

从文本信息中预测韵律层级结构是语音合成的关键,对于提升合成语音的自然度与表现力、构建智能人机对话系统具有重要作用。

韵律层级预测至今还有许多问题没有得到很好解决。首先,对于影响韵律结构的文本特征以及因素之间关系的描述不够确切,其次,单一模型的准确度难以达到理想状态。从汉语韵律结构预测的现有研究来看,关于韵律建模方法的技术研究较多,而关于影响韵律结构的因素以及因素之间关系的研究较少。

目前韵律结构的预测主要有基于规则的方法、基于统计机器学习的方法、规则和统计相结合的方法。从所使用的信息源来看,多为语句中的词性、词长信息以及浅层语法信息,较少利用深层语法和语义信息。专利CN 104867490B将词向量的聚类特征加入从标注数据提取的特征集合之中,专利CN 104867491B基于同义词词林对训练语料文本中的分词进行泛化,引入语义信息后提升了模型预测准确性。然而这些语义分析都是以词为单位的,对韵律结构的作用有限,没有将更高层次的句法组块的语义角色考虑进来,也没有分析语用因素。

语言学研究发现普通话韵律边界和韵律模式是句法、语义、语用综合作用的结果。基于语义角色的句法组块的分类影响韵律结构的层级,而韵律边界处的语用信息和长度信息则影响韵律成分跨界与否。因此在韵律结构预测过程中需要引入更多句法语义和语用相关的信息,使模型准确性得到提升。

发明内容

本发明提供一种融合句法语义语用信息的汉语韵律结构预测方法。除了利用传统预测线索之外,发明中引入了深层句法、语义角色标注以及语用信息,基于这些多维特征对韵律结构的作用模式,并通过统计与规则相结合的方式实现文本标注、特征提取以及韵律结构预测,从而更好提升语音合成的自然度。

一种融合句法语义语用信息的汉语韵律结构预测方法,包括如下步骤:

步骤一、对已经分词和词性标注的文本进行语义角色的句块划分;

步骤二、对句块进行语法分析,并对语法结构关系松紧度进行标记;

步骤三、根据句块以及句块的语法结构关系对韵律结构进行初步切分;

步骤四、对句子中的名词性成分的信息结构进行标记;

步骤五、根据语法结构、初步划分的韵律结构以及信息结构进行语用信息的标注;

步骤六、根据语用信息对初步切分的韵律结构进行调整。

如上所述的一种融合句法语义语用信息的汉语韵律结构预测方法,其中:步骤一中,所述语义角色指谓语根据其与相关的名词短语之间的语义关系而指派给这些名词短语的角色;所述名词短语语义角色包括核心语义角色和附加语义角色。语义角色的句块划分依据CPB语料库运用统计方法实现。

如上所述的一种融合句法语义语用信息的汉语韵律结构预测方法,其中:步骤二中,所述语法结构关系松紧度包括黏合类、组合类、等立类;松紧度根据语法结构形式判定。语法结构形式根据统计建模句法分析得到。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京灵伴即时智能科技有限公司,未经北京灵伴即时智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810200521.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top