[发明专利]语速相依韵律讯息产生装置及语速相依的阶层式韵律模块有效

专利信息
申请号: 201310066969.4 申请日: 2013-03-01
公开(公告)号: CN103680491A 公开(公告)日: 2014-03-26
发明(设计)人: 陈信宏;王逸如;江振宇;谢乔华 申请(专利权)人: 财团法人交大思源基金会
主分类号: G10L13/08 分类号: G10L13/08
代理公司: 上海申新律师事务所 31272 代理人: 竺路玲
地址: 中国台湾*** 国省代码: 中国台湾;71
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 语速 相依 韵律 讯息 产生 装置 阶层 模块
【说明书】:

技术领域

发明系关于一种韵律讯息产生装置,尤指一种以语速相依的阶层式韵律模块为基础的韵律讯息产生装置。

背景技术

目前对于相异语速语音合成的讨论不少,但始终不能达成一流畅的自然合成语音。其中有以每个语音音框的时间轴进行伸张及压缩,藉以调整说话速度慢及快的研究,但并未考虑到语速对于韵律结构的影响;以线性预估的方式对输入语音进行语速修正,对输入的语音信号以线性插入或移除信号本身的研究,该方法虽简易有效率,但对于语速的考虑过于粗糙;以清化元音(devoiced vowel)的决定中考虑了语速影响,有效地改进清化元音在慢语速的退化程度的研究,但其韵律的产生方法并未考虑语速的影响;以对不同语速语料库建立韵律结构的转换关系,藉以达到语速转换的目的的研究,但该方法并不能掌握到连续语速的转换变化;虽有文献实现了可控制语速的TTS(Text-to-Speech),首先对三种速度(快、正常、慢)各自建立音长模型,对三个音长模型以内插方式来产生目标语速所需的音长,最后结合于HMM为基础的语音合成器,此方法仅考虑韵律之中的音长部份,并未对其它韵律参数进行语速影响调整,且由于不同语速需各自建立自己的音长模型,会使得模型参数量大增;再则它使用内插法去产生音长,无法获得准确的语速控制;另有文献对正常及快速语料分别建立HSMM模型,再以CMLLR对音长模型进行音长平均值的语速调适,该方法仅考虑韵律之中的音长部份,且由于不同语速需各自建立自己的音长模型,会使得模型参数量大增;及有进行大规模主观测试三种语速控制的方法研究,分别为:(1)针对目标语速选取相近语速的语料来训练HMM模型,(2)依比例去伸缩合成语句的发音长度,及(3)基于ML准则去决定状态长度(state duration),这些方法都是建立于HMM-based的语音合成系统,实验结果发现方法(2)最适合用于快语速合成语音,而方法(1)较适合慢速语音,不同的语速控制方法都只适于某种语速,并没有一种方法能掌握所有语速的控制。

因此,可知习知技术大多以等比例拉长或缩短各个合成单元(如音节、词)的长度来达到语速控制,而于韵律结构、音高轨迹、停顿时间长度及停顿出现频率方面较少着墨,并无考虑声学韵律讯息其背后的产生模型,因此并不能以系统化的方式掌握语速对于韵律多层面的影响,进而用以产生韵律讯息;这些韵律讯息可充分应用于语音合成的语速控制,使各种语速的合成语音应用在语音合成的领域听起来都很流利自然。

爰是之故,申请人有鉴于习知技术的缺失,乃经悉心试验与研究,并一本锲而不舍的精神,终发明出本案「语速相依的韵律讯息产生器及语速相依的阶层式韵律模块」,用以改善上述习用手段的缺失。

发明内容

本案的一面向系提供一韵律讯息产生装置,包含一第一输入端,用以接收一语速;一第二输入端,用以接收一语言参数;一语速相依的韵律生成模块,用以配合该语言参数及该语速,以产生该语速相依的一韵律声学特征参数;及一输出端,用以输出与该语速相依的韵律声学特征参数。

本案的另一面向系提供一种语速相依的阶层式韵律模块,包含至少二模型,其中各该模型系选自由一音节韵律声学模型、一停顿声学模型、一韵律状态模型、一停顿语法模型及其组合之一,俾与一语速相依。

本案的又一面向系提供一种语速相依的阶层式韵律模块,包含至少二参数,其中各该参数系选自由一停顿类型、一韵律状态一音节韵律声学特征参数、一音节间韵律声学特征参数及一音节差分韵律声学特征参数及其组合之一,俾该模块与一语速相依。

附图说明

图1:本案一较佳实施例的建构语速相依的阶层式韵律模块流程图。

图2:本案一较佳实施例的产生语速相依的韵律声学特征参数简易流程图。

图3:本案一较佳实施例的语料库语速统计图。

图4:本案一较佳实施例的汉语语音阶层式韵律结构示意图。

图5:本案一较佳实施例的七种停顿类别的停顿时长平均值对语速的关系图。

图6(a)~(b):本案一较佳实施例的不同声调的基频轨迹于不同语速的差异图。

图7:本案一较佳实施例的产生语速相依的韵律声学特征参数流程图。

【主要组件符号说明】

101:语音语料库

102:语速估计

103:语速正规化函式的建构

104:韵律声学特征参数的语速正规化

105:修正型阶层式韵律模型训练算法

106:语速相依的阶层式韵律模块

201:文字分析器

202:语速相依的韵律参数产生方法

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于财团法人交大思源基金会,未经财团法人交大思源基金会许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201310066969.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top