[发明专利]声音处理装置、声音处理方法和程序无效
申请号: | 201310684752.X | 申请日: | 2013-12-13 |
公开(公告)号: | CN103886865A | 公开(公告)日: | 2014-06-25 |
发明(设计)人: | 东山惠祐 | 申请(专利权)人: | 索尼公司 |
主分类号: | G10L21/02 | 分类号: | G10L21/02;H04R27/02 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 杜诚;王娜丽 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 声音 处理 装置 方法 程序 | ||
1.一种声音处理装置,包括:
背景噪声估计单元,被配置成估计输入信号的背景噪声;
噪声抑制单元,被配置成基于通过估计所述背景噪声而获得的结果,来抑制所述输入信号的背景噪声;
特征量计算单元,被配置成基于抑制了所述背景噪声的所述输入信号而计算特征量;以及
辅音检测单元,被配置成基于所述特征量来从所述输入信号检测辅音。
2.根据权利要求1所述的声音处理装置,
其中,所述背景噪声估计单元在频域中估计所述背景噪声,
其中,所述噪声抑制单元通过抑制从所述输入信号获得的输入谱中包括的背景噪声而获得噪声抑制谱,以及
其中,所述特征量计算单元基于所述噪声抑制谱而计算所述特征量。
3.根据权利要求2所述的声音处理装置,其中,所述背景噪声估计单元通过获得先前输入谱的平均值而估计所述背景噪声。
4.根据权利要求3所述的声音处理装置,还包括:
辅音增强单元,被配置成针对这样的频率增强所述输入谱:在该频率处,所述噪声抑制谱的值大于通过将背景噪声谱乘以常数所获得的值,所述背景噪声谱是通过对所述背景噪声的估计而获得的。
5.根据权利要求4所述的声音处理装置,其中,所述辅音增强单元以预定增强量增强所述输入谱。
6.根据权利要求4所述的声音处理装置,还包括:
辅音增强水平计算单元,被配置成基于所述输入信号的当前功率与所述输入信号的先前元音部分的功率的平均值之比而计算增强量,
其中,所述辅音增强单元以所述增强量增强所述输入谱。
7.根据权利要求6所述的声音处理装置,其中,关于频率方向执行所述增强量的内插。
8.根据权利要求2所述的声音处理装置,其中,所述噪声抑制单元通过使用谱减法而获得所述噪声抑制谱。
9.根据权利要求2所述的声音处理装置,其中,所述输入信号的音调强度也用作特征量,以及
其中,所述辅音检测单元基于作为所述特征量的音调强度和根据所述噪声抑制谱算出的特征量而从所述输入信号检测辅音。
10.根据权利要求9所述的声音处理装置,其中,所述音调强度由在音调频率的位置和所述音调频率的谐波频率的位置生成所述噪声抑制谱的峰的程度来表示。
11.根据权利要求9所述的声音处理装置,其中,所述音调强度是所述输入信号的自相关系数值。
12.根据权利要求2所述的声音处理装置,其中,所述特征量计算单元将所述噪声抑制谱的频带划分为多个子带,并且基于所述子带中的所述噪声抑制谱的代表值而计算所述特征量。
13.根据权利要求12所述的声音处理装置,其中,所述噪声抑制谱是功率谱。
14.根据权利要求12所述的声音处理装置,其中,所述噪声抑制谱是幅度谱。
15.根据权利要求12所述的声音处理装置,其中,所述代表值是所述子带中的所述噪声抑制谱的平均值。
16.根据权利要求12所述的声音处理装置,其中,所述代表值是所述子带中的所述噪声抑制谱的最大值。
17.根据权利要求12所述的声音处理装置,其中,所述特征量计算单元计算所述噪声抑制谱中的所述子带的代表值之间的时间差分值作为所述特征量。
18.一种声音处理方法,包括:
估计输入信号的背景噪声;
基于通过估计所述背景噪声而获得的结果,来抑制所述输入信号的背景噪声;
基于抑制了所述背景噪声的所述输入信号而计算特征量;以及
基于所述特征量从所述输入信号检测辅音。
19.一种用于使得计算机执行以下处理的程序:
估计输入信号的背景噪声;
基于通过估计所述背景噪声而获得的结果,来抑制所述输入信号的背景噪声;
基于抑制了所述背景噪声的所述输入信号而计算特征量;以及
基于所述特征量从所述输入信号检测辅音。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于索尼公司,未经索尼公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310684752.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种精密贴合机
- 下一篇:全自动培养基灌装机械