[发明专利]声音合成装置有效

专利信息
申请号: 201410133441.9 申请日: 2014-04-03
公开(公告)号: CN104464717B 公开(公告)日: 2017-11-03
发明(设计)人: 大塚贵弘;川岛启吾;古田训;山浦正 申请(专利权)人: 三菱电机株式会社
主分类号: G10L13/06 分类号: G10L13/06
代理公司: 中国国际贸易促进委员会专利商标事务所11038 代理人: 崔成哲
地址: 日本*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 声音 合成 装置
【说明书】:

技术领域

本发明涉及与输入语言信息的时间系列对应地从声音片段合成声音来生成合成声音的声音合成装置。

背景技术

在基于大容量的声音数据库的声音合成方式中,提出了通过代替组合了根据预期的知识决定的物理性的参数的尺度,而将基于在声音识别等中使用的HMM(Hidden Markov Model,隐马尔可夫模型)的统计性的似然度用作尺度,从而一并具有基于依照HMM的合成方式的概率尺度的合理性和声音质量的均匀性的优点、和基于大容量的声音数据库的声音合成方式的高质量这样的优点的、以实现高质量并且均质的合成声音为目的的声音合成方法(参照例如专利文献1)。

在专利文献1中,使用表示按照音韵输出每个状态迁移的音响参数(线性预测系数、倒谱等)系列的概率的音响模型、和表示按照韵律输出每个状态迁移的韵律参数(基本频率等)系列的概率的韵律模型,通过与构成针对输入文本的音韵系列的各音韵对应的每个状态迁移的音响参数系列的音响上的似然度、和与构成针对输入文本的韵律系列的各韵律对应的每个状态迁移的韵律参数系列的韵律上的似然度,计算声音片段成本,选择声音片段。

【专利文献1】日本特开2004-233774号公报

发明内容

但是,在上述那样的以往的声音合成方法中,对于声音片段的选择,难以决定如何决定按照音韵,得不到恰当的按照音韵的音响模型,存在无法恰当地求出输出音响参数系列的概率这样的问题。另外,关于韵律,也同样地,难以决定如何决定按照韵律,得不到恰当的按照韵律的韵律模型,存在无法恰当地求出输出韵律参数系列的概率的问题。

另外,在以往的声音合成方法中,通过按照音韵的音响模型,计算音响参数系列的概率,所以按照音韵的音响模型不成为适合于依赖于韵律参数系列的音响参数系列的模型,存在无法恰当地输出音响参数系列的概率这样的问题。另外,关于韵律,也同样地,通过按照韵律的韵律模型,计算韵律参数系列的概率,所以按照韵律的韵律模型不成为适合于依赖于音响参数系列的韵律参数系列的韵律模型,存在无法恰当地求出输出韵律参数系列的概率这样的问题。

另外,在以往的声音合成方法中,使用设定与输入文本对应的音韵系列(每个音韵的功率、音韵长、基本频率),按照音韵输出每个状态迁移的音响参数系列的音响模型存储单元的内容记载于专利文献1中,但在使用了这样的单元的情况下,存在如果音韵系列的设定的精度低,则无法选择恰当的音响模型这样的问题。另外,还存在需要音韵系列的设定,动作变得繁杂的问题。

另外,在以往的声音合成方法中,预先根据输出音响参数系列、韵律参数系列等声音参数系列的概率,计算声音片段成本,不成为考虑了声音参数的听觉上的重要性的声音片段成本,存在所得到的声音片段听觉上成为不自然这样的问题。

本发明是为了解决上述那样的课题而完成的,其目的在于得到一种能够制作高质量的合成声音的声音合成装置。

本发明提供一种声音合成装置,其特征在于,具备:候补声音片段系列制作部,针对作为所输入的声音单位的时间系列的输入语言信息系列,参照积蓄声音片段的时间系列的声音片段数据库来制作候补声音片段系列;输出声音片段决定部,使用表示与输入语言信息系列、和表示候补声音片段系列中的多个候补声音片段各自的属性的声音参数的共生条件对应的值的参数,来计算候补声音片段系列适合于输入语言信息系列的程度,根据适合的程度,决定输出声音片段系列;以及波形片段连接部,连接与输出声音片段系列对应的声音片段来制作声音波形。

本发明的声音合成装置使用表示与输入语言信息系列、和表示候补声音片段系列中的多个候补声音片段各自的属性的声音参数的共生条件对应的值的参数,计算候补声音片段系列适合于输入语言信息系列的程度,根据适合的程度,决定输出声音片段系列,所以能够制作高质量的合成声音。

附图说明

图1是示出本发明的实施方式1~5的声音合成装置的结构图。

图2是示出本发明的实施方式1~5的声音合成装置的输入语言信息系列的说明图。

图3是示出本发明的实施方式1~5的声音合成装置的声音片段数据库的说明图。

图4是示出本发明的实施方式1~5的声音合成装置的参数辞典的说明图。

图5是示出本发明的实施方式1~5的声音合成装置的动作的流程图。

图6是示出本发明的实施方式1的声音合成装置的输入语言信息系列和候补声音片段系列的一个例子的说明图。

符号说明

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三菱电机株式会社,未经三菱电机株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201410133441.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top