[发明专利]声音信号纠正方法、声音信号纠正设备以及计算机程序有效
申请号: | 200710008338.1 | 申请日: | 2007-01-29 |
公开(公告)号: | CN101154384A | 公开(公告)日: | 2008-04-02 |
发明(设计)人: | 松尾直司 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G10L21/02 | 分类号: | G10L21/02;G10L19/02;G10L15/20;G10L11/00;G10L11/02 |
代理公司: | 隆天国际知识产权代理有限公司 | 代理人: | 张龙哺 |
地址: | 日本神奈*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 声音 信号 纠正 方法 设备 以及 计算机 程序 | ||
技术领域
本发明涉及一种声音信号纠正方法、应用所述声音信号纠正方法的声音信号纠正设备以及用于实施所述声音信号纠正设备的计算机程序,其中所述声音信号纠正方法用于根据与噪声图(noise pattern)相关的噪声模型纠正基于获取的声音的声音信号。特别地,本发明涉及一种为获取的声音提高语音识别率的声音信号纠正方法、声音信号纠正设备以及计算机程序。
背景技术
噪声抑制技术能够抑制在有噪声的环境下获取的声音中的噪声成分,其目的用于提高诸如汽车导航器等语音识别设备中的语音识别率,并用于提高与语音相关的设备的质量,例如提高电话机中发送语音的质量。
图1为在概念上示出传统噪声抑制技术的示意图。根据传统噪声抑制技术,获取包括噪声和语音的声音,并通过FFT(快速傅立叶变换)处理,将按帧划分且基于获取的声音的声音信号、即输入信号in(n)转换为相位频谱tan-1IN(f)和振幅频谱|IN(f)|。然后,根据与声音信号的振幅频谱|IN(f)|具有很高相似度的噪声模型,估算稳态噪声的振幅频谱|N(f)|,并从声音信号的振幅频谱|IN(f)|中减去估算的稳态噪声的振幅频谱|N(f)|。接着,通过逆FFT处理转换已减去稳态噪声的振幅频谱|N(f)|的振幅频谱|IN(f)|和相位频谱tan-1IN(f),从而导出每个帧的输出信号out(n)。作为其中噪声被抑制的声音信号,导出的输出信号用于例如语音识别处理。
图2A和图2B为示出与传统噪声抑制技术相关的振幅频谱的坐标图。图2A示出声音信号的振幅频谱|IN(f)|中频率值与振幅值之间的关系,而图2B示出已减去稳态噪声的振幅频谱|N(f)|的振幅频谱|IN(f)|中频率值与振幅值之间的关系。在比较图2A和图2B时清楚可知,在图2B所示的波形中已从输入信号的振幅频谱|IN(f)|中减去估算的稳态噪声的振幅频谱|N(f)|,从而抑制了噪声。这种噪声抑制技术称为谱减法,并且例如在日本专利申请特开平No.07-193548(1995)中公开了使用谱减法的噪声抑制技术。
然而,噪声包括随时间而改变的非稳态成分,从而在日本专利申请特开平No.07-193548(1995)所述的使用谱减法的噪声抑制技术中,留下非稳态成分。例如,图2A和图2B所示的波形涉及仅由噪声构成的输入信号,如图2B所示,在抑制稳态噪声时,留下高度非稳态噪声。以这种方式留下的噪声是非自然噪声,因此与用于语音识别的声音模型中包含的噪声模型的匹配度低,从而导致噪声识别的精度低之类的问题。具体来说,引起误差,从而使留下的噪声被识别为谱功率较低的音位,例如“s”和“n”。因此,对噪声的抑制与语音识别率的提高不相关;相反地,出现引起语音识别率降低的问题。此外,出现产生音乐噪声之类的非自然噪声的问题。
发明内容
为了解决上述问题提出了本发明,并且本发明的目的是提供声音信号纠正方法、应用所述声音信号纠正方法的声音信号纠正设备以及用于实施所述声音信号纠正设备的计算机程序,其中所述声音信号纠正方法通过比较声音信号与噪声模型并基于比较结果平滑化声音信号的波形而能够防止留下非自然噪声,从而使噪声识别精度提高、提高语音识别率以及防止产生音乐噪声。
根据本发明第一方案提供一种声音信号纠正方法,根据与噪声图相关的噪声模型来纠正基于获取的声音的声音信号,其包括以下步骤:将所述声音信号与所述噪声模型进行比较;以及基于比较结果平滑化所述声音信号的波形。
根据本发明第二方案提供一种声音信号纠正设备,根据与噪声图相关的噪声模型来纠正基于获取的声音的声音信号,其包括:用于将所述声音信号与所述噪声模型进行比较的装置;以及用于基于比较结果平滑化所述声音信号的波形的装置。
根据本发明第三方案提供一种声音信号纠正设备,根据与噪声图的频谱相关的噪声模型来纠正基于获取的声音的声音信号的频谱,其包括:导出装置,通过将所述声音信号的频谱与所述噪声模型进行比较来导出用于纠正所述声音信号的纠正系数;以及平滑化装置,使用导出的纠正系数平滑化所述声音信号的波形。
根据本发明第四方案提供一种声音信号纠正设备,在根据第三方案的声音信号纠正设备中:所述导出装置根据所述声音信号的频谱强度与基于所述噪声模型确定的阈值之差,导出所述纠正系数。
根据本发明第五方案提供一种声音信号纠正设备,在根据第三或第四方案的声音信号纠正设备中:所述平滑化装置平滑化所述声音信号的频谱在频率轴方向的变化。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710008338.1/2.html,转载请声明来源钻瓜专利网。