[发明专利]声音判断装置及声音判断方法有效
申请号: | 201110375314.6 | 申请日: | 2011-11-23 |
公开(公告)号: | CN102479504A | 公开(公告)日: | 2012-05-30 |
发明(设计)人: | 山边孝朗 | 申请(专利权)人: | JVC建伍株式会社 |
主分类号: | G10L11/00 | 分类号: | G10L11/00 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 谢丽娜;关兆辉 |
地址: | 日本神*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 声音 判断 装置 方法 | ||
1.一种声音判断装置,其特征在于,具有:
帧化部,以具有预先确定的时长的帧单位截取输入信号,生成帧化输入信号;
频谱生成部,将上述帧化输入信号从时间区域变换为频率区域,生成集中了每个频率的频谱的频谱图;
峰值检测部,判断上述频谱图的各频谱与多个分割频带中含有上述频谱的分割频带中的各频带能量之间的能量比是否超过预先确定的第1阈值,其中上述多个分割频带是通过预先确定的带宽分割的频带;
声音判断部,根据上述峰值检测部的判断结果,判断上述帧化输入信号是否是声音;
频率平均部,导出上述频谱图的各分割频带中的频谱的频率方向的平均能量;以及
时间平均部,按照每个上述分割频带,分别导出上述各频带能量,即上述平均能量的时间方向的平均。
2.根据权利要求1所述的声音判断装置,其特征在于,
上述声音判断部在上述能量比超过上述第1阈值的频谱为预先确定的个数以上时,判断上述帧化输入信号是声音。
3.根据权利要求1或2所述的声音判断装置,其特征在于,
上述时间平均部,基于将包括上述能量比超过上述第1阈值的频谱的上述分割频带的平均能量、或包括上述能量比超过上述第1阈值的频谱的帧化输入信号的所有分割频带的平均能量乘以1以下的调整值而得到的能量,按照每个上述分割频带,导出各频带能量。
4.根据权利要求1或2所述的声音判断装置,其特征在于,
上述频率平均部,排除上述能量比超过上述第1阈值的频谱、或排除上述能量比超过上述第1阈值的频谱以及与上述频谱相邻的频谱,导出平均能量。
5.根据权利要求1或2所述的声音判断装置,其特征在于,
上述时间平均部,将包括上述能量比超过上述第1阈值的频谱的上述分割频带的平均能量、或包括上述能量比超过上述第1阈值的频谱的帧化输入信号的所有分割频带的平均能量,不反映到上述时间方向的平均中。
6.根据权利要求1至5的任意一项所述的声音判断装置,其特征在于,
设置用于判断是否将上述平均能量反映到上述时间方向的平均中的、与上述第1阈值不同的第2阈值,
上述时间平均部,将包括上述能量比超过上述第2阈值的频谱的上述分割频带的平均能量、或包括上述能量比超过上述第2阈值的频谱的帧化输入信号的所有分割频带的平均能量,不反映到上述时间方向的平均中。
7.根据权利要求1至6的任意一项所述的声音判断装置,其特征在于,上述频谱生成部至少生成200Hz到700Hz的频谱图。
8.根据权利要求1至7的任意一项所述的声音判断装置,其特征在于,上述预先确定的带宽是100Hz到150Hz的带宽。
9.一种声音判断方法,其特征在于,
以具有预先确定的时长的帧单位截取输入信号,生成帧化输入信号,
将上述帧化输入信号从时间区域变换为频率区域,生成集中了每个频率的频谱的频谱图,
在上述频谱图的各频谱与多个分割频带中含有上述频谱的分割频带中的各频带能量之间的能量比超过了预先确定的第1阈值时,判断上述帧化输入信号是声音,其中上述多个分割频带通过预先确定的带宽分割的频带,
导出上述频谱图的各分割频带中的频谱的频率方向的平均能量,
按照每个上述分割频带,分别导出上述各频带能量,即上述平均能量的时间方向的平均。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于JVC建伍株式会社,未经JVC建伍株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110375314.6/1.html,转载请声明来源钻瓜专利网。