[发明专利]混响去除参数估计装置以及方法、混响/回波去除参数估计装置、混响去除装置、混响/回波去除装置、以及混响去除装置在线会议系统有效
申请号: | 201380009596.5 | 申请日: | 2013-02-15 |
公开(公告)号: | CN104115223B | 公开(公告)日: | 2017-02-22 |
发明(设计)人: | 户上真人;川口洋平 | 申请(专利权)人: | 株式会社日立制作所 |
主分类号: | G10L21/0208 | 分类号: | G10L21/0208;G10L21/0216;H04B3/23;H04R3/02 |
代理公司: | 永新专利商标代理有限公司72002 | 代理人: | 高迪 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 混响 去除 参数估计 装置 以及 方法 回波 在线 会议系统 | ||
技术领域
本发明属于涉及从进入麦克风的声音之中,仅对期望的声音进行拾音(pick up)的噪声去除及/或混响成分的去除技术的技术领域。
背景技术
研究了用于从麦克风所包含的声音之中,对声音被房间的墙壁或天花板等反射因而产生的混响成分高精度地进行去除,而仅对从说话者的嘴边直接到达麦克风的成分(直接音成分)高精度地进行拾音的混响去除技术(例如参照非专利文献1)。
图1表示室内的声音的传播过程的示意图。如图1所示,从说话者的嘴边发出而通过麦克风受音的成分能够大致分为从说话者的嘴边至麦克风为止沿最短路径传播的成分即直接音成分(参照图1的(i))、以及反射到墙壁、地面、或室内的人而反弹的声音混入麦克风的成分即混响成分。
至今为止的混响去除技术对于进入麦克风的声音,将传播特性的逆滤波器估计为线性滤波器,将所估计出的线性滤波器与麦克风输入信号重叠。由此,能够作为将麦克风输入信号分为直接音成分和混响成分这两个,仅提取没有混响的直接音成分的技术。以往,将其作为该混响成分的传播路径不随时间变动的非变动性(non-fluctuating)混响成分(参照图1的(ii))。
但是,实际上,除了非变动性混响成分之外,还有在反射到在室内移动的人(头等移动)等后传达到麦克风的成分即变动性(fluctuating)混响成分(参照图1的(iii))。能够理解为该变动性混响成分是在线性滤波器中不能充分消去的成分。关于这样的变动性混响成分,提出了通过非线性滤波器进行去除的技术(例如参照专利文献1)。
现有技术文献
专利文献
专利文献1:特许第4107613号公报
非专利文献
非专利文献1:T.Yoshioka et al.,“Blind separation and dereverberation of speech mixtures by joint optimization,”IEEE Trans.ASLP,vol.19,no.1,pp.69-84,Jan.2011
非专利文献2:K.Kinoshita et al.,“Suppression of Late Reverberation Effect on Speech Signal Using Long-Term Multiple-step Linear Prediction,”IEEE Trans.ASLP,vol.17,no.4,pp.534-545,2009
发明内容
发明要解决的课题
在以往的使用了线性滤波器的混响去除方式(例如参照非专利文献1)中,在声音从说话者的嘴边传递至麦克风为止时的传递函数不变化的前提下去除混响成分。
但是,例如在会议场景等中,受到说话者的面部的朝向或说话者以外的人(头等)移动等的影响,传递函数每时每刻发生变化的情况很多。在这样的情况下,首先存在以下课题:若在用于估计线性滤波器的信号之中包含传递函数起伏的时间段,则传递函数的估计精度下降,结果混响去除性能下降(课题1)。此外,存在以下课题:即使高精度地求得了线性滤波器,在线性滤波器中除了传递函数不变化的情况以外不能降低混响,传递函数起伏的时间段中的混响抑制性能较差(课题2)。
另一方面,在使用了非线性滤波器的非线性的混响去除技术中,通过增大用于控制降低混响成分的量的参数,能够增加混响去除量。
但是,若不能适当地设定参数,则导致使本来希望取得的声音成分失真的量增加,结果希望取得的声音的提取精度下降。
本发明是鉴于这样的状况而完成的,提供从麦克风输入信号高精度地去除非变动性以及变动性的混响成分,对用于提高直接音的提取精度的参数进行估计的技术、以及使用该参数将混响成分从麦克风输入信号中去除的技术。
用于解决课题的手段
(i)为了解决上述课题,本发明提出使用了线性滤波器的混响去除方式和使用了非线性滤波器的混响去除方式的综合算法。更具体而言,具有按每时间计测后级的非线性滤波器中传递函数的起伏的量的功能,基于该功能对每时间的非线性滤波器的强度进行控制(对参数的生成进行控制)。由此,由于设为仅在传递函数的起伏大时施加较强的非线性处理的结构,所以能够将声音成分的失真保持为最小限度。此外,将通过非线性处理得到的变动性混响成分的估计值反馈到线性滤波器的参数生成处理,使得非变动性混响成分去除的精度进一步提高。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社日立制作所,未经株式会社日立制作所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201380009596.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:过电流保护装置
- 下一篇:行驶控制装置以及行驶控制方法