[发明专利]声音信号纠正方法、声音信号纠正设备以及计算机程序有效

申请号：	200710008338.1	申请日：	2007-01-29
公开（公告）号：	CN101154384A	公开（公告）日：	2008-04-02
发明（设计）人：	松尾直司	申请（专利权）人：	富士通株式会社
主分类号：	G10L21/02	分类号：	G10L21/02;G10L19/02;G10L15/20;G10L11/00;G10L11/02
代理公司：	隆天国际知识产权代理有限公司	代理人：	张龙哺
地址：	日本神奈***	国省代码：	日本;JP
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	声音信号纠正方法设备以及计算机程序
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及一种声音信号纠正方法、应用所述声音信号纠正方法的声音信号纠正设备以及用于实施所述声音信号纠正设备的计算机程序，其中所述声音信号纠正方法用于根据与噪声图(noise pattern)相关的噪声模型纠正基于获取的声音的声音信号。特别地，本发明涉及一种为获取的声音提高语音识别率的声音信号纠正方法、声音信号纠正设备以及计算机程序。

背景技术

噪声抑制技术能够抑制在有噪声的环境下获取的声音中的噪声成分，其目的用于提高诸如汽车导航器等语音识别设备中的语音识别率，并用于提高与语音相关的设备的质量，例如提高电话机中发送语音的质量。

图1为在概念上示出传统噪声抑制技术的示意图。根据传统噪声抑制技术，获取包括噪声和语音的声音，并通过FFT(快速傅立叶变换)处理，将按帧划分且基于获取的声音的声音信号、即输入信号in(n)转换为相位频谱tan^-1IN(f)和振幅频谱|IN(f)|。然后，根据与声音信号的振幅频谱|IN(f)|具有很高相似度的噪声模型，估算稳态噪声的振幅频谱|N(f)|，并从声音信号的振幅频谱|IN(f)|中减去估算的稳态噪声的振幅频谱|N(f)|。接着，通过逆FFT处理转换已减去稳态噪声的振幅频谱|N(f)|的振幅频谱|IN(f)|和相位频谱tan^-1IN(f)，从而导出每个帧的输出信号out(n)。作为其中噪声被抑制的声音信号，导出的输出信号用于例如语音识别处理。

图2A和图2B为示出与传统噪声抑制技术相关的振幅频谱的坐标图。图2A示出声音信号的振幅频谱|IN(f)|中频率值与振幅值之间的关系，而图2B示出已减去稳态噪声的振幅频谱|N(f)|的振幅频谱|IN(f)|中频率值与振幅值之间的关系。在比较图2A和图2B时清楚可知，在图2B所示的波形中已从输入信号的振幅频谱|IN(f)|中减去估算的稳态噪声的振幅频谱|N(f)|，从而抑制了噪声。这种噪声抑制技术称为谱减法，并且例如在日本专利申请特开平No.07-193548(1995)中公开了使用谱减法的噪声抑制技术。

然而，噪声包括随时间而改变的非稳态成分，从而在日本专利申请特开平No.07-193548(1995)所述的使用谱减法的噪声抑制技术中，留下非稳态成分。例如，图2A和图2B所示的波形涉及仅由噪声构成的输入信号，如图2B所示，在抑制稳态噪声时，留下高度非稳态噪声。以这种方式留下的噪声是非自然噪声，因此与用于语音识别的声音模型中包含的噪声模型的匹配度低，从而导致噪声识别的精度低之类的问题。具体来说，引起误差，从而使留下的噪声被识别为谱功率较低的音位，例如“s”和“n”。因此，对噪声的抑制与语音识别率的提高不相关；相反地，出现引起语音识别率降低的问题。此外，出现产生音乐噪声之类的非自然噪声的问题。

发明内容

为了解决上述问题提出了本发明，并且本发明的目的是提供声音信号纠正方法、应用所述声音信号纠正方法的声音信号纠正设备以及用于实施所述声音信号纠正设备的计算机程序，其中所述声音信号纠正方法通过比较声音信号与噪声模型并基于比较结果平滑化声音信号的波形而能够防止留下非自然噪声，从而使噪声识别精度提高、提高语音识别率以及防止产生音乐噪声。

根据本发明第一方案提供一种声音信号纠正方法，根据与噪声图相关的噪声模型来纠正基于获取的声音的声音信号，其包括以下步骤：将所述声音信号与所述噪声模型进行比较；以及基于比较结果平滑化所述声音信号的波形。

根据本发明第二方案提供一种声音信号纠正设备，根据与噪声图相关的噪声模型来纠正基于获取的声音的声音信号，其包括：用于将所述声音信号与所述噪声模型进行比较的装置；以及用于基于比较结果平滑化所述声音信号的波形的装置。

根据本发明第三方案提供一种声音信号纠正设备，根据与噪声图的频谱相关的噪声模型来纠正基于获取的声音的声音信号的频谱，其包括：导出装置，通过将所述声音信号的频谱与所述噪声模型进行比较来导出用于纠正所述声音信号的纠正系数；以及平滑化装置，使用导出的纠正系数平滑化所述声音信号的波形。

根据本发明第四方案提供一种声音信号纠正设备，在根据第三方案的声音信号纠正设备中：所述导出装置根据所述声音信号的频谱强度与基于所述噪声模型确定的阈值之差，导出所述纠正系数。

根据本发明第五方案提供一种声音信号纠正设备，在根据第三或第四方案的声音信号纠正设备中：所述平滑化装置平滑化所述声音信号的频谱在频率轴方向的变化。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于富士通株式会社，未经富士通株式会社许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/200710008338.1/2.html，转载请声明来源钻瓜专利网。

上一篇：多面体低聚倍半硅氧烷单体组装的方法
下一篇：驱动具有容性阻抗的器件的驱动方法和装置以及图像拾取装置

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L21-00 为了改变语音信号的质量或其可识度而处理语音信号，以产生另一种可听的或非可听的信号，例如视觉信号或触觉信号
G10L21-02 .语音增强，例如降低噪声或消除回声
G10L21-04 .时间压缩或扩展
G10L21-06 .将语音转换成非可听表达形式，例如语音可视化、触觉辅助的语音处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]声音信号纠正方法、声音信号纠正设备以及计算机程序有效

专利文献下载