[发明专利]频率轴伸缩系数估计设备、系统方法以及程序有效
申请号: | 200880108790.8 | 申请日: | 2008-09-22 |
公开(公告)号: | CN101809652A | 公开(公告)日: | 2010-08-18 |
发明(设计)人: | 江森正 | 申请(专利权)人: | 日本电气株式会社 |
主分类号: | G10L15/20 | 分类号: | G10L15/20;G10L13/06;G10L15/02;G10L15/04;G10L15/06 |
代理公司: | 北京东方亿思知识产权代理有限责任公司 11258 | 代理人: | 宋鹤;南霆 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 频率 伸缩 系数 估计 设备 系统 方法 以及 程序 | ||
技术领域
本身请主张在先日本专利申请第2007-247572号(2007年9月25日申请)的优选权,所述在先申请的全部记载内容以引用的方式合并在本申请文件中。
本发明涉及语音处理技术,尤其涉及用于对以语音在频率轴上的伸缩表示的说话人特性进行归一化的伸缩系数估计设备、倒谱变换系统、语音识别系统、波形合成系统、方法以及程序。
背景技术
在语音识别领域中,为了提高识别性能的精度,提出了修正由说话人的声道长度的差异引起的声谱的共振频率的波动的方法。这种技术被称作声道长度归一化。作为声道长度归一化的方法,例如,在专利文件1(日本专利公告公报3632529号)中,利用倒谱空间上的线性变换将共振频率的偏差模型化,由此有效地估计了偏差的大小。
专利文件1中提出的声道长度归一化的构成包括:由分析语音并输出倒谱的分析部、基于倒谱估计表示伸缩程度的伸缩系数值的伸缩估计部、以及利用伸缩系数的值对倒谱进行线性变换的变换部。
变换部中使用的线性变换利用了通过利用全通滤波器的逆变换来将频率轴上的变换表示为倒谱的线性变换的方式。在该变换中使用的参数的个数为1。
专利文件1在伸缩系数的估计中使用了在语言识别中使用的HMM(Hidden Markov Model,隐式马尔可夫模型)。如在专利文件1中也记载的那样,在语言识别中使用的HMM是将以单词或音素等为单位的音韵信息的输出概率模型化的模型。
例如,将日语“はい”分解成音素,作为“h a i”,并将这些每个 h,a,i的出现概率模型化。如果例举作为经常使用的出现概率形式的正态分布,则此时,对每个音素事先计算倒谱等特征量的值的平均和方差,并在进行识别等时使用。在专利文件1中,为了估计伸缩系数,使用下式(1)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于日本电气株式会社,未经日本电气株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200880108790.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:输入装置
- 下一篇:提供语音到语音翻译和模拟人类属性的化身的移动无线显示器