[发明专利]语音分析方法和装置、语音合成方法和装置、以及存储语音分析程序的介质有效
申请号: | 201410392430.2 | 申请日: | 2014-08-11 |
公开(公告)号: | CN104347080B | 公开(公告)日: | 2018-08-10 |
发明(设计)人: | 橘诚 | 申请(专利权)人: | 雅马哈株式会社 |
主分类号: | G10L25/03 | 分类号: | G10L25/03;G10L13/033 |
代理公司: | 北京天昊联合知识产权代理有限公司 11112 | 代理人: | 陈源;李铭 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 分析 方法 装置 合成 以及 存储 程序 介质 | ||
1.一种语音分析方法,包括:
变量提取步骤,其产生相对音高的时间序列,
其中所述相对音高是从乐曲数据产生的在包括音高相异的各音符之间的分界时间点的时间轴上连续波动的音高和参考语音的音高之差,
其中所述乐曲数据按时间序列指定乐曲的各个音符,
其中所述参考语音是通过歌唱所述乐曲而得到的语音,并且
其中通过对未检测到音高的无语音区间进行插值处理来处理所述参考语音的音高;和
特性分析步骤,其产生歌唱特性数据,所述歌唱特性数据定义了用于表示在所述变量提取步骤中产生的所述相对音高的时间序列的模型。
2.根据权利要求1所述的语音分析方法,其中所述变量提取步骤包括:
转变产生步骤,其从所述乐曲数据产生在时间轴上连续波动的音高;
音高检测步骤,其检测所述参考语音的音高;
插值处理步骤,其对所述参考语音的未检测到音高的无语音区间设置音高;和
差计算步骤,其计算在所述转变产生步骤中产生的音高和在所述插值处理步骤中处理的音高之差,以作为所述相对音高,
其中所述插值处理步骤根据紧接所述无语音区间之前的第一区间内的音高的时间序列来设置所述无语音区间的紧接该第一区间之后的第一插值区间内的音高,并且
其中所述插值处理步骤根据紧接所述无语音区间之后的第二区间内的音高的时间序列来设置所述无语音区间的紧接该第二区间之前的第二插值区间内的音高。
3.根据权利要求1所述的语音分析方法,其中所述特性分析步骤包括:
区间设置步骤,其通过使用预定持续时间作为单位将所述乐曲分成多个单位区间;和
分析处理步骤,其产生所述歌唱特性数据,
其中对于所述模型的多个状态的每一个而言,所述歌唱特性数据包括分类信息和变量信息,
其中所述分类信息用于将由所述区间设置步骤划分的所述多个单位区间分类到多个集合中,并且
其中所述变量信息定义了被分类到所述多个集合的每一个中的所述多个单位区间的每一个内的所述相对音高的时间序列的概率分布。
4.根据权利要求3所述的语音分析方法,其中所述分类信息包括决策树。
5.根据权利要求4所述的语音分析方法,其中所述分析处理步骤包括从对于所述模型的多个状态共同的基本决策树产生每个状态的决策树。
6.根据权利要求5所述的语音分析方法,其中每个状态的决策树包括与所述乐曲在时间轴上划分的每个乐句和所述多个单位区间的每一个之间的关系相对应的条件。
7.根据权利要求3所述的语音分析方法,其中通过基于与所述音符的属性相关的条件的第一分类处理和通过基于与所述多个单位区间的每一个的属性相关的条件的第二分类处理来产生所述分类信息。
8.根据权利要求1所述的语音分析方法,其中所述模型是用于表示多个状态之间的概率转变的概率模型。
9.一种语音分析装置,包括:
变量提取单元,其被配置为产生相对音高的时间序列,
其中所述相对音高是从乐曲数据产生的在包括音高相异的各音符之间的分界时间点的时间轴上连续波动的音高和参考语音的音高之差,
其中所述乐曲数据按时间序列指定乐曲的各个音符,
其中所述参考语音是通过歌唱所述乐曲而得到的语音,并且
其中通过对未检测到音高的无语音区间进行插值处理来处理所述参考语音的音高;和
特性分析单元,其被配置为产生歌唱特性数据,所述歌唱特性数据定义了用于表示由所述变量提取单元产生的所述相对音高的时间序列的模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于雅马哈株式会社,未经雅马哈株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410392430.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:十二烷基羟磺基甜菜碱生产工艺
- 下一篇:乙酰谷酰胺及其注射液与制备方法