[发明专利]定量的F0轮廓生成装置及方法、以及用于生成F0轮廓的模型学习装置及方法在审
申请号: | 201480045803.7 | 申请日: | 2014-08-13 |
公开(公告)号: | CN105474307A | 公开(公告)日: | 2016-04-06 |
发明(设计)人: | 倪晋富;志贺芳则 | 申请(专利权)人: | 国立研究开发法人情报通信研究机构 |
主分类号: | G10L13/10 | 分类号: | G10L13/10 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 赵琳琳 |
地址: | 日本国*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 定量 f0 轮廓 生成 装置 方法 以及 用于 模型 学习 | ||
1.一种定量的基频F0轮廓生成装置,其中,包括:
针对通过文本解析而获得的发声的韵律词,利用所赋予的数量的目标 点来生成基频F0轮廓的音调成分的单元;
按照包含发声的构造的语言信息,将发声分为包含一个以上的韵律词 的小组,从而利用被限定的数量的目标点来生成基频F0轮廓的短语成分 的单元;和
基于所述音调成分和所述短语成分来生成基频F0轮廓的单元。
2.一种定量的基频F0轮廓生成方法,其中,包括:
针对通过文本解析而获得的发声的韵律词,利用所赋予的数量的目标 点来生成基频F0轮廓的音调成分的步骤;
按照包含发声的构造的语言信息,将发声分为包含一个以上的韵律词 的小组,从而利用被限定的数量的目标点来生成基频F0轮廓的短语成分 的步骤;和
基于所述音调成分和所述短语成分来生成基频F0轮廓的步骤。
3.一种定量的基频F0轮廓生成装置,其中,包括:
模型存储单元,其存储基频F0轮廓的短语成分的目标参数生成用的 生成模型和基频F0轮廓的音调成分的目标参数生成用的生成模型的参数;
文本解析单元,其接受成为声音合成的对象的文本的输入来进行文本 解析,输出声音合成用的控制符号串;
短语成分生成单元,其将所述文本解析单元所输出的控制符号串与所 述短语成分生成用的生成模型进行比对,从而来生成基频F0轮廓的短语 成分;
音调成分生成单元,其将所述文本解析单元所输出的控制符号串与所 述音调成分生成用的生成模型进行比对,从而来生成基频F0轮廓的音调 成分;和
基频F0轮廓生成单元,其合成由所述短语成分生成单元生成的短语 成分和由所述音调成分生成单元生成的音调成分,从而来生成基频F0轮 廓。
4.一种定量的基频F0轮廓生成方法,使用模型存储单元,该模型 存储单元存储有基频F0轮廓的短语成分的目标参数生成用的生成模型和 基频F0轮廓的音调成分的目标参数生成用的生成模型的参数,其中,
所述定量的基频F0轮廓生成方法包括:
文本解析步骤,接受成为声音合成的对象的文本的输入来进行文本解 析,输出声音合成用的控制符号串;
短语成分生成单元,将在所述文本解析中输出的控制符号串与所述存 储单元中存储的所述短语成分生成用的生成模型进行比对,从而来生成基 频F0轮廓的短语成分;
音调成分生成步骤,将在所述文本解析步骤中输出的控制符号串与所 述存储单元中存储的所述音调成分生成用的生成模型进行比对,从而来生 成基频F0轮廓的音调成分;和
基频F0轮廓生成步骤,合成在所述短语成分生成步骤中生成的短语 成分和在所述音调成分生成步骤中生成的音调成分,从而来生成基频F0 轮廓。
5.一种用于生成基频F0轮廓的模型学习装置,其中,包括:
基频F0轮廓提取单元,其从声音数据信号中提取基频F0轮廓;
参数估计单元,其为了通过短语成分和音调成分的叠加来表征与所提 取出的基频F0轮廓拟合的基频F0轮廓,估计表征短语成分的目标参数 和表征音调成分的目标参数;和
模型学习单元,其将由所述参数估计单元估计出的短语成分的目标参 数及音调成分的目标参数所表征的连续的基频F0轮廓作为学习数据,来 进行基频F0生成模型的学习。
6.根据权利要求5所述的用于生成基频F0轮廓的模型学习装置, 其中,
所述基频F0生成模型包括短语成分生成用的生成模型和音调成分生 成用的生成模型,
所述模型学习单元包括:将由所述参数估计单元估计出的短语成分的 目标参数所表征的短语成分的时间变化轮廓、和音调成分的目标参数所表 征的音调成分的时间变化轮廓分别作为学习数据,来进行所述短语成分生 成用的生成模型和所述音调成分生成用的生成模型的学习的单元。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国立研究开发法人情报通信研究机构,未经国立研究开发法人情报通信研究机构许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201480045803.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:音频信号编码器
- 下一篇:呈现与映射元素关联的摘要信息的系统和方法