[发明专利]直达声提取装置和混响声提取装置有效
申请号: | 201280015523.2 | 申请日: | 2012-06-14 |
公开(公告)号: | CN103503066A | 公开(公告)日: | 2014-01-08 |
发明(设计)人: | 桥本武志;渡边哲生;笛木俊宏 | 申请(专利权)人: | 歌乐株式会社 |
主分类号: | G10L21/0232 | 分类号: | G10L21/0232;G10L21/0208 |
代理公司: | 北京林达刘知识产权代理事务所(普通合伙) 11277 | 代理人: | 刘新宇 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 直达声 提取 装置 混响 | ||
技术领域
本发明涉及一种直达声提取装置和混响声提取装置,尤其涉及可以从包含混响声的输入信号提取直达声的直达声提取装置、以及可以从该输入信号提取混响声的混响声提取装置。
背景技术
在诸如礼堂等的容易出现混响声的环境内播放音乐和进行演讲等并且进行记录的情况下,所记录的声学信号通常不仅包含直达声而且还包含在该记录期间卷积得到的混响声。因此,在其它声学环境下播放卷积有混响声的声学信号的情况下,直达声的清晰度下降,这有可能造成在播放声学信号时很难收听。
在使用卷积有混响声的演讲声音来进行语音识别等的情况下,问题在于演讲声音(内容)的识别率将由于因混响声所引起的清晰度的下降而下降。
关于如上所述的卷积有混响声的声学信号,已知有用于降低混响声的传统技术(例如,参见专利文献1)。使用该技术使得能够通过降低混响声来使直达声清晰。
现有技术文献
专利文献
专利文献1:日本特开2010-74531
发明内容
发明要解决的问题
然而,根据专利文献1所述的方法,为了降低输入信号中所包含的混响声,需要执行诸如伪白化处理、多步骤线性预测处理和后端混响预测处理等的各种信号处理。因此,需要大量处理负荷。因而,为了实际降低混响声,需要诸如微处理器或数字信号处理器等的高性能装置。就成本和其它因素而言,问题在于无法毫不改变地容易地使用专利文献1的方法。
本发明是考虑到上述问题而作出的。本发明的目的是提供一种可以从包含混响声的声学信号中容易地提取直达声或混响声的直达声提取装置和混响声提取装置。
用于解决问题的方案
根据本发明,一种直达声提取装置,包括:傅立叶变换单元,用于对直达声中包含混响声的输入信号进行傅立叶变换处理;谱变换单元,用于基于由所述傅立叶变换单元进行了傅立叶变换处理的所述输入信号的具有实数和虚数的频率谱,将所述输入信号变换成第一振幅谱信号和相位谱信号;低通滤波器单元,用于通过使用预设的标准化截止频率来针对各频率对所述第一振幅谱信号进行低通滤波处理;第一限幅器单元,用于对由所述低通滤波器单元进行了低通滤波处理的第二振幅谱信号的负侧振幅进行限制,从而使该负侧振幅为零;第一减法单元,用于通过从所述第一振幅谱信号中减去由所述第一限幅器单元对负侧振幅进行了限制的所述第二振幅谱信号来计算第三振幅谱信号;第二限幅器单元,用于对由所述第一减法单元计算出的所述第三振幅谱信号的负侧振幅进行限制,从而使该负侧振幅为零;逆谱变换单元,用于基于所述相位谱信号和由所述第二限幅器单元对负侧振幅进行了限制的所述第三振幅谱信号,计算由具有实数和虚数的频率谱构成的信号;以及逆傅立叶变换单元,用于对由所述逆谱变换单元计算出的信号进行逆傅立叶变换处理,以生成通过从所述输入信号提取所述直达声所获得的直达声信号。
本发明的直达声提取装置对直达声中包含混响声的输入信号进行傅立叶变换,并且使用预设的标准化截止频率对谱变换单元所计算出的第一振幅谱信号进行低通滤波处理。这样,该直达声提取装置计算出针对各谱积分得到的信号(积分信号:第二振幅谱信号)。如此积分得到的信号等同于构成输入信号的时间变化中的稳态成分的谱信号、即混响声信号。
因此,第一减法单元通过从第一振幅谱信号中减去第二振幅谱信号所计算出的第三振幅谱信号是通过从输入信号中减去混响声所获得的信号。该处理使得可以计算出等同于直达声信号的信号。
因此,逆谱变换单元和逆傅立叶变换单元所生成的信号是通过从输入信号提取直达声所获得的信号。结果,从直达声中包含混响声的输入信号可以容易地提取出直达声。
此外,通过调节标准化截止频率,可以调节输入信号中所包含的直达声的提取时间。随着标准化截止频率的值变得越小,输入信号中所包含的直达声的提取时间变得越长,这使得能够以不仅包含非稳态声而且还包含稳态声的方式进行直达声的提取。由于以包含稳态声的方式提取直达声,因此与完全不包含稳态声的直达声相比,可以向该直达声添加诸如音色和易听性等的性质。在收听者收听该直达声的情况下,该收听者可以将该直达声识别为无不适感的声音。
发明的效果
本发明的直达声提取装置可以从直达声中包含混响声的输入信号容易地提取直达声。本发明的混响声提取装置可以从直达声中包含混响声的输入信号容易地提取混响声。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于歌乐株式会社,未经歌乐株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201280015523.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:轨道交通外挂式声屏障
- 下一篇:一种日光温室卷帘机定位升降控制器