首页在售求购查询申请展会资讯专利榜企服商城升级VIP

立即登录免费注册

在售专利
求购专利
查询专利
新闻资讯
技术展会
招商加盟
专利榜

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

[发明专利]引导式说话人自适应语音合成的系统与方法及程序产品在审

申请号：	201310127602.9	申请日：	2013-04-12
公开（公告）号：	CN103778912A	公开（公告）日：	2014-05-07
发明（设计）人：	林政源;林政贤;郭志忠	申请（专利权）人：	财团法人工业技术研究院
主分类号：	G10L13/02	分类号：	G10L13/02
代理公司：	北京市柳沈律师事务所 11105	代理人：	陈小雯
地址：	中国台***	国省代码：	中国台湾;71
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	引导说话自适应语音合成系统方法程序产品
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种引导式说话人自适应语音合成系统，包含：

一说话人自适应训练模块，根据输入的录音文稿与对应的录音语句，输出自适应信息与说话人自适应模型；

一文字转语音合成引擎，接收该录音文稿与该说话人自适应模型，输出合成语句信息；

一成果评估模块，接收该自适应信息、该合成语句信息，估计出评估信息；以及

一自适应建议模块，根据该自适应信息与该评估信息内容，从文稿来源中选取出后续要录制的录音文稿，以作为下一次自适应的建议。

2.如权利要求1所述的系统，其中该自适应训练模块所输出的该自适应信息至少包括：

该录音文稿、该录音语句、该录音文稿对应的音素与模型信息、以及该录音语句对应的切音信息。

3.如权利要求2所述的系统，其中该模型信息至少包括频谱模型信息、与韵律模型信息。

4.如权利要求1所述的系统，该文字转语音合成引擎所输出的该合成语句信息至少包括：该录音文稿的合成语句，以及该合成语句的切音信息。

5.如权利要求1所述的系统，其中该评估信息至少包括该录音语句的音素与模型覆盖率。

6.如权利要求5所述的系统，其中该音素与模型覆盖率包括音素覆盖率、频谱模型覆盖率、以及韵律模型覆盖率。

7.如权利要求1所述的系统，其中该评估信息至少包括一或多个语音差异评估参数。

8.如权利要求7所述的系统，其中该一或多个语音差异评估参数至少包括该录音语句和该合成语句的频谱失真度。

9.如权利要求1所述的系统，其中该自适应建议模块选取录音文稿的策略是能够让该音素与模型的覆盖率最大化。

10.如权利要求1所述的系统，其中该系统是采用基于隐藏式马可夫模型或者隐藏式半马可夫模型架构的语音合成系统。

11.如权利要求1所述的系统，其中该系统经由不断地自适应与提供文稿建议的方式来进行说话人自适应。

12.如权利要求1所述的系统，其中该系统输出该合成语句、该成果评估模块估计出的该目前录音语句的评估信息、以及该自适应建议模块做出的下一次自适应语句的建议。

13.一种引导式说话人自适应语音合成方法，包含：

输入录音文稿与对应的录音语句，输出说话人自适应模型与自适应信息；

载入该说话人自适应模型，输入该录音文稿，以合成出合成语音信息；

结合该自适应信息与该合成语音信息，估计出评估信息；以及

根据该自适应信息与该评估信息内容，从文稿来源中选取出后续要录制的录音文稿，作为下一次自适应的建议。

14.如权利要求13所述的方法，其中该评估信息包括该目前录音语句的音素覆盖率、频谱模型覆盖率、韵律模型覆盖率、以及一或多个语音差异评估参数。

15.如权利要求13所述的方法，其中该一或多个语音差异评估参数至少包括频谱失真度。

16.如权利要求13所述的方法，其中该方法先进行一权重重估计后，再利用一基于音素覆盖率最大化的算法与一基于模型覆盖率最大化的算法来选取出后续要录制的该录音文稿。

17.如权利要求16所述的方法，其中该权重重估计是根据频谱失真度来决定新的音素权重、及模型权重，并且是利用一种音色相似度的方法来动态调整权重的高低。

18.如权利要求17所述的方法，其中该调整权重的原则为，当一语音单位的频谱失真度高于一高阈值，调升该语音单位的权重；反之当一语音单位的频谱失真度低于一低阈值时，调降该语音单位的权重。

19.如权利要求18所述的方法，其中该语音单位是字、音节、或音素的其中一种或多种组合。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于财团法人工业技术研究院，未经财团法人工业技术研究院许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201310127602.9/1.html，转载请声明来源钻瓜专利网。

上一篇：一种基于Home-IOT的红外自适应学习的方法及系统
下一篇：一种油性防锈剂及其制备方法

同类专利

专利分类

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L13-00 语音合成；文本-语音合成系统
G10L13-02 .产生合成语音的方法；语音合成设备
G10L13-06 .语音合成设备中使用的基本语音单位；级联规则
G10L13-08 .文本分析或文本以外的语音合成参数的产生，例如语义图翻译为音素、韵律产生、重音或声调测定
G10L13-04 ..语音合成系统的零部件，例如合成设备结构或存储器管理

免登录下载普通用户下载升级VIP会员，免费下载

友情链接：交换友情链接需要网站权重大于4，网站收录10W以上，如符合条件，请联系QQ：。

关于我们寻求报道投稿须知广告合作版权声明网站地图友情链接企业标识联系我们

在线咨询

周一至周五 9:00-18:00

版权所有http://www.vipzhuanli.com/公布日期

咨询在线客服

咨询在线客服

tel code back_top