[发明专利]通话语音处理装置、通话语音处理方法及程序无效
申请号: | 200910209333.4 | 申请日: | 2009-11-04 |
公开(公告)号: | CN101740035A | 公开(公告)日: | 2010-06-16 |
发明(设计)人: | 难波隆一;安部素嗣;西口正之 | 申请(专利权)人: | 索尼株式会社 |
主分类号: | G10L21/00 | 分类号: | G10L21/00;G10L19/00 |
代理公司: | 北京东方亿思知识产权代理有限责任公司 11258 | 代理人: | 李晓冬;南霆 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 通话 语音 处理 装置 方法 程序 | ||
技术领域
本发明涉及通话语音处理装置、通话语音处理方法及程序,并且更具体地涉及利用成像麦克风(imaging microphone)提高通话语音质量的通话语音处理装置、通话语音处理方法及程序。
背景技术
在诸如移动电话之类的通信装置中通常仅使用单个通话麦克风来拨打电话。因此,难以通过利用多个麦克风来使用空间传输特性的差异从而提高质量。为了通过使用单个语音移除噪声,不存在对诸如频谱删减(spectrum subtraction)之类的将失真添加到输出声音的技术的替代技术。
因此,考虑了添加麦克风来收集或移除环境声音以提高通话语音质量的方法。根据该方法,可以通过从通话麦克风所记录的声音中删减去所添加麦克风收集的环境声音来实现较高质量的通话语音。
顺便提及,近年来,通信装置逐渐具有成像功能。因此,利用成像麦克风提高通话语音质量可以认为是可实现的,而无需如上所述的添加麦克风。例如,可以考虑如下方法:通过分离来源于多个声源的声音,来仅强调通话语音。作为强调声音的方法,例如,可以考虑如下方法:将包括多个部分的音乐信号分离为各个部分,并且在重新混合经分离的声音之前强调重要的部分(例如,日本专利申请早期公开No.2002-236499)。
发明内容
然而,日本专利申请早期公开No.2002-236499是打算用于音乐信号的,而不是用于通话语音的技术。还存在如下问题:成像麦克风的频率特性与通话麦克风的频率特性极不相同,并且各个麦克风的布置未必被优化用于提高通话语音的质量。
本发明是鉴于上面的问题而作出的,并且希望提供能够利用不同特性的麦克风来强调通话语音的通话语音处理装置、通话语音处理方法及程序。
根据本发明的一个实施例,提供了通话语音处理装置,包括:输入校正单元,将从第一输入装置输入的第一输入声音的特性校正为与第一输入声音的特性不同的、从第二输入装置输入的第二输入声音的特性;声音分离单元,当多个声音被包含在第二输入声音中时,将第二输入声音分离为多个声音;声音类型估计单元,估计经声音分离单元分离的多个声音的声音类型;混合比计算单元,根据由声音类型估计单元估计出的声音类型来计算每个声音的混合比;声音混合单元,以混合比计算单元计算出的混合比混合经声音分离单元分离的多个声音;以及提取单元,利用由声音混合单元混合的经混合声音从经输入校正单元校正后的第一输入声音中提取特定声音。
根据上面的配置,从通话语音处理装置的第一输入装置输入的第一输入声音的特性被校正为从第二输入装置输入的第二输入声音的特性。第二输入声音被分离为由多个声源产生的声音,并且多个经分离的声音类型被估计。然后,根据估计出的声音类型计算每个声音的混合比,并且以混合比重新混合每个经分离的声音。然后,利用被重新混合后的经混合声音,从校正了其特性的第一输入声音中提取通话语音。
因此,可以利用诸如具有不同特性的麦克风之类的输入装置来强调通话语音。即,可以通过利用与通话语音处理装置设置在一起的第二输入装置从输入到第一输入装置的第一输入声音中提取通话语音,来舒适地进行通话。例如,在所希望的通话语音被音量高于通话语音音量的噪声掩盖而使得难以听见所希望通话语音后,可以防止适当的通话语音中断。而且,可以利用第二输入装置来提取用户所希望的通话语音,而不用将收集或移除环境声音的麦克风添加到通话语音处理装置。
第一输入装置可以是通话麦克风,第二输入装置可以是成像麦克风,并且由提取单元提取的特定声音可以是通话者的语音。
声音分离单元可以将第一输入声音和第二输入声音分离为多个声音。
声音确定单元确定第一输入声音是否包含通话者的语音。
声音确定单元可以通过利用输入声音的音量、频谱、多个输入声音的相位差以及离散时间处的幅度信息分布中的至少一个来确定声源的方向、距离和音调(tone),从而判断通话者声源是否被包含。
输入校正单元可以校正第一输入声音和/或第二输入声音的频率特性。
输入校正单元可以对第一输入声音和/或第二输入声音执行采样速率转换。
输入校正单元可以校正因第一输入声音和/或第二输入声音的A/D转换引起的延迟差。
相同性(identity)确定单元判断经声音分离单元分离的声音在多个块间是否相同,并且记录单元以块为单位记录经声音分离单元分离的声音。
声音分离单元可以利用声音的统计独立性以及空间传输特性的差异来将输入声音分离为多个声音。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于索尼株式会社,未经索尼株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910209333.4/2.html,转载请声明来源钻瓜专利网。