[发明专利]用于特征提取的装置、方法以及计算机程序产品无效
申请号: | 200910118520.1 | 申请日: | 2009-02-26 |
公开(公告)号: | CN101521009A | 公开(公告)日: | 2009-09-02 |
发明(设计)人: | 木田祐介;益子贵史 | 申请(专利权)人: | 株式会社东芝 |
主分类号: | G10L15/10 | 分类号: | G10L15/10 |
代理公司: | 北京市中咨律师事务所 | 代理人: | 杨晓光;于 静 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 特征 提取 装置 方法 以及 计算机 程序 产品 | ||
相关申请的交叉引用
本申请基于在2008年2月29日提交的日本专利申请No.2008-50313并要求其优先权的权益;其全部内容通过援引纳入本申请中。
技术领域
本发明涉及用于特征提取的装置、方法以及计算机程序产品,其从输入语音信号中计算基音频率(pitch frequency)之间的差异。
背景技术
每单位时间的差分基音频率是语音韵律信息的一个要素。通过差分基音频率信息,可以获得重音、语调的信息,以及语音是发音还是未发音的声音。因此,在语音识别设备、话音活动检测器、基音频率估计设备、说话人识别设备等等中采用差分基音频率信息。例如,在Sadaoki Furui发表在Tokai University Press,pp.57-59(1985)上的“Dijitaru onsei Shori(Digital Speech Processing)”中描述了一种获得差分基音频率信息的方法。根据在该文献中的方法,首先估计基因频率,然后计算基音频率随时间改变的量以获得差分基音频率信息。
然而,采用上述文献中的方法,却估计了错误的基音频率,因此从这些基音频率获得的差分基音频率也是错误的。最近,提出了较不易受到基音频率估计中的误差影响的获得差分基音频率信息的方法。在JP-A2940835(KOKAI)中描述了一种这样的方法。根据该文献,计算了在时间(帧)t和s处的语音的预测残差的自相关函数之间的互相关函数。然后,提取该互相关函数的峰以便获得差分基音频率信息,在差分基音频率信息中由于考虑了多个基音频率选择而减小了在基音频率估计中的误差的影响。
然而,采用根据JP-A 2940835(KOKAI)的方法,基音频率估计基于语音的预测残差。这意味着,当提取互相关函数的峰值时,在背景噪声的影响下估计了不对应差分基音频率的峰值,这使得难以获得精确的差分基音频率信息。此外,在预测残差的自相关函数中,在整数倍的基音周期处出现了多个峰。如果纳入在整数倍处的峰,差分的量也要乘以该整数。出于该原因,为了获得精确的差分基音频率信息,用于获得互相关函数的预测残差的自相关函数的范围要窄到接近精确的基音频率。那么,必须提前计算基音频率,并且必须根据说话人的话音基音适宜地确定基音频率的范围。然而,技术上难以适宜地确定基音频率的范围。出于该原因,寻找这样一种获得差分基音频率信息的技术,其中减小背景噪声的影响,而不需缩小基音频率的范围。
发明内容
根据本发明的一个方面,一种特征提取装置包括:谱计算单元,被配置为基于输入语音信号为以规则时间间隔限定的帧中的每一个帧计算具有在对数频率尺度上规则间隔处获得的频率分量的频率谱,并由此产生所述频率谱的时间序列;互相关系数计算单元,被配置为对于所述帧中的每一个目标帧计算为邻近所述目标帧并彼此间隔预定帧宽度的两个不同的帧而计算的频率谱之间的互相关系数;以及移动量预测单元,被配置为使用所述互相关系数来预测在对数频率尺度上所述频率谱相对于所述预定帧宽度的移动量。
根据本发明的另一方面,一种在包括谱计算单元、互相关系数计算单元和移动量预测单元的特征提取装置中执行的特征提取方法,所述方法包括:通过所述谱计算单元,基于输入语音信号,为以规则时间间隔限定的帧中的每一个帧计算具有在对数频率尺度上规则间隔处获得的频率分量的频率谱,并由此产生所述频率谱的时间序列;通过互相关系数计算单元,对于所述帧中的每一个目标帧计算为邻近所述目标帧并彼此间隔预定帧宽度的两个不同的帧而计算的频率谱之间的互相关系数;以及通过移动量预测单元,使用所述互相关系数来预测在对数频率尺度上所述频率谱相对于所述预定帧宽度的移动量。
根据本发明的又一方面的计算机程序产品使计算机执行根据本发明的方法。
附图说明
图1是示出了根据第一实施例的语音识别设备21的硬件结构的图;
图2是详细示出了根据实施例的特征提取函数的框图;
图3是示出了根据实施例由特征提取装置100执行的特征提取方法的过程的流程图;
图4是示出了根据实施例在步骤S300中由互相关系数计算单元102执行的计算互相关系数的操作的详细过程的流程图;
图5是示出了根据实施例由移动量预测单元103执行的预测移动量的操作的详细过程的流程图;
图6的示图示出了对于清洁话音的发声段中包括的两个邻近的帧,由根据实施例的谱计算单元101计算的示例性频率谱;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社东芝,未经株式会社东芝许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910118520.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:再生装置
- 下一篇:自动交易装置和自动交易装置的确认画面显示方法