[发明专利]辅音区间检测装置及辅音区间检测方法有效
申请号: | 201210022303.4 | 申请日: | 2012-02-01 |
公开(公告)号: | CN102629470A | 公开(公告)日: | 2012-08-08 |
发明(设计)人: | 明智明子;山边孝朗 | 申请(专利权)人: | JVC建伍株式会社 |
主分类号: | G10L11/00 | 分类号: | G10L11/00;G10L11/06 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 王凝;陆锦华 |
地址: | 日本神*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 辅音 区间 检测 装置 方法 | ||
技术领域
本发明涉及一种检测输入信号的辅音区间的辅音区间检测装置及辅音区间检测方法。
背景技术
人的声音可分类为元音和辅音、或浊音和清音等。因此,利用元音、辅音、浊音及清音等各自的特征,开发出了进行声音检测、识别的技术。
具体而言,提出了以下技术方案:对于浊音和清音,根据对输入信号的帧的零交叉数进行计数的零交叉法,比较帧间的零交叉数,识别浊音和清音(例如专利文献1)。
专利文献1:特开2007-292940号公报
发明内容
而在检测输入信号中含有的声音时,元音和辅音相比能量较大,因此在噪声电平较大的环境下,元音区间(含有元音的区间)的检测较为容易,但辅音区间(含有辅音的区间)的检测容易产生辅音特征淹没于噪声的误测。
并且,将上述专利文献1的零交叉法应用于辅音区间的检测时,当噪声振幅偏向时,因振幅偏向的影响而产生偏移,产生输入信号不与0交叉而振动的区间,出现无法检测出辅音区间的情况。
因此,本发明鉴于以上问题而出现,其目的在于提供一种在较高的噪声电平的环境下也可高精度检测出辅音区间的辅音区间检测装置及辅音区间检测方法。
为解决上述课题,本发明的辅音区间检测装置的特征在于具有:帧化部,以预先确定的帧单位截取输入信号,生成帧化输入信号;频谱生成部,将上述帧化输入信号从时间区域变换为频率区域,生成集中了每个频率的频谱的频谱图;平均导出部,导出上述频谱图中的、连续的预先确定的每个带宽的平均能量即各频带平均能量;辅音判断部,将导出的上述各频带平均能量之间进行比较,越高频带的各频带平均能量成为越高的能量时,判断上述帧化输入信号中含有辅音。
也可以是,辅音判断部对于在频谱图的相邻的频带间的各频带平均能量中高频的频带的各频带平均能量比相邻的低频的频带的各频带平均能量大的组合进行计数,当计数的计数值为预先确定的第1阈值以上时,判断为含有辅音。
也可以是,辅音判断部,对于在频谱图的相邻的频带间的各频带平均能量中高频的频带的各频带平均能量比相邻的低频的频带的各频带平均能量大的组合,在上述大的组合跨过频带连续的情况下进行加权并进行计数,当计数的计数值为预先确定的第2阈值以上时,判断为含有辅音。
也可以是,辅音判断部,提取在相邻的频带间的各频带平均能量中高频的频带的各频带平均能量比相邻的低频的频带的各频带平均能量大的组合,将提取的上述组合之间进行比较,对高频的频带的各频带平均能量大的组合的个数进行计数,当计数的计数值为预先确定的第3阈值以上时,判断为含有辅音。
也可以是,辅音判断部包括:第1判断单元,对于相邻的频带间的各频带平均能量中高频的频带的各频带平均能量比相邻的低频的频带的各频带平均能量大的组合进行计数,在计数的计数值为预先确定的第1阈值以上时,判断为含有辅音;以及第2判断单元,对于相邻的频带间的各频带平均能量中高频的频带的各频带平均能量比相邻的低频的频带的各频带平均能量大的组合,在上述大的组合跨过频带连续的情况下进行加权并进行计数,当计数的计数值为预先确定的第2阈值以上时,判断为含有辅音,辅音判断部还具有:噪声电平导出部,导出上述帧化输入信号的噪声电平;以及判断选择部,当导出的上述噪声电平小于第4阈值时,选择第1判断单元,当导出的上述噪声电平为上述第4阈值以上时,选择第2判断单元。
也可以是,辅音判断部还包括第3判断单元,提取上述相邻的频带间的各频带平均能量中高频的频带的各频带平均能量比相邻的低频的频带的各频带平均能量大的组合,将提取的上述组合之间进行比较,对高频的频带的各频带平均能量比相邻的低频的频带的各频带平均能量大的组合的个数进行计数,当计数的计数值为预先确定的第3阈值以上时,判断为含有辅音,判断选择部在通过上述第2判断单元未判断辅音时,选择上述第3判断单元。
为解决上述课题,本发明的辅音区间检测方法的特征在于,以预先确定的帧单位截取输入信号,生成帧化输入信号,将帧化输入信号从时间区域变换为频率区域,生成集中了每个频率的频谱的频谱图,导出上述频谱图中的、连续的预先确定的每个带宽的平均能量即各频带平均能量,将导出的各频带平均能量之间进行比较,越高频带的各频带平均能量成为越高的能量时,判断帧化输入信号中含有辅音。
如上所述,在本发明中,在较高的噪声电平的环境下也可高精度地检测出辅音区间。
附图说明
图1是用于说明辅音区间的说明图。
图2是用于说明辅音区间的说明图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于JVC建伍株式会社,未经JVC建伍株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210022303.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:虚像显示装置
- 下一篇:一种隔水套管顶部张紧装置