[发明专利]辅音区间检测装置及辅音区间检测方法有效

专利信息
申请号: 201210022303.4 申请日: 2012-02-01
公开(公告)号: CN102629470A 公开(公告)日: 2012-08-08
发明(设计)人: 明智明子;山边孝朗 申请(专利权)人: JVC建伍株式会社
主分类号: G10L11/00 分类号: G10L11/00;G10L11/06
代理公司: 中原信达知识产权代理有限责任公司 11219 代理人: 王凝;陆锦华
地址: 日本神*** 国省代码: 日本;JP
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 辅音 区间 检测 装置 方法
【说明书】:

技术领域

本发明涉及一种检测输入信号的辅音区间的辅音区间检测装置及辅音区间检测方法。

背景技术

人的声音可分类为元音和辅音、或浊音和清音等。因此,利用元音、辅音、浊音及清音等各自的特征,开发出了进行声音检测、识别的技术。

具体而言,提出了以下技术方案:对于浊音和清音,根据对输入信号的帧的零交叉数进行计数的零交叉法,比较帧间的零交叉数,识别浊音和清音(例如专利文献1)。

专利文献1:特开2007-292940号公报

发明内容

而在检测输入信号中含有的声音时,元音和辅音相比能量较大,因此在噪声电平较大的环境下,元音区间(含有元音的区间)的检测较为容易,但辅音区间(含有辅音的区间)的检测容易产生辅音特征淹没于噪声的误测。

并且,将上述专利文献1的零交叉法应用于辅音区间的检测时,当噪声振幅偏向时,因振幅偏向的影响而产生偏移,产生输入信号不与0交叉而振动的区间,出现无法检测出辅音区间的情况。

因此,本发明鉴于以上问题而出现,其目的在于提供一种在较高的噪声电平的环境下也可高精度检测出辅音区间的辅音区间检测装置及辅音区间检测方法。

为解决上述课题,本发明的辅音区间检测装置的特征在于具有:帧化部,以预先确定的帧单位截取输入信号,生成帧化输入信号;频谱生成部,将上述帧化输入信号从时间区域变换为频率区域,生成集中了每个频率的频谱的频谱图;平均导出部,导出上述频谱图中的、连续的预先确定的每个带宽的平均能量即各频带平均能量;辅音判断部,将导出的上述各频带平均能量之间进行比较,越高频带的各频带平均能量成为越高的能量时,判断上述帧化输入信号中含有辅音。

也可以是,辅音判断部对于在频谱图的相邻的频带间的各频带平均能量中高频的频带的各频带平均能量比相邻的低频的频带的各频带平均能量大的组合进行计数,当计数的计数值为预先确定的第1阈值以上时,判断为含有辅音。

也可以是,辅音判断部,对于在频谱图的相邻的频带间的各频带平均能量中高频的频带的各频带平均能量比相邻的低频的频带的各频带平均能量大的组合,在上述大的组合跨过频带连续的情况下进行加权并进行计数,当计数的计数值为预先确定的第2阈值以上时,判断为含有辅音。

也可以是,辅音判断部,提取在相邻的频带间的各频带平均能量中高频的频带的各频带平均能量比相邻的低频的频带的各频带平均能量大的组合,将提取的上述组合之间进行比较,对高频的频带的各频带平均能量大的组合的个数进行计数,当计数的计数值为预先确定的第3阈值以上时,判断为含有辅音。

也可以是,辅音判断部包括:第1判断单元,对于相邻的频带间的各频带平均能量中高频的频带的各频带平均能量比相邻的低频的频带的各频带平均能量大的组合进行计数,在计数的计数值为预先确定的第1阈值以上时,判断为含有辅音;以及第2判断单元,对于相邻的频带间的各频带平均能量中高频的频带的各频带平均能量比相邻的低频的频带的各频带平均能量大的组合,在上述大的组合跨过频带连续的情况下进行加权并进行计数,当计数的计数值为预先确定的第2阈值以上时,判断为含有辅音,辅音判断部还具有:噪声电平导出部,导出上述帧化输入信号的噪声电平;以及判断选择部,当导出的上述噪声电平小于第4阈值时,选择第1判断单元,当导出的上述噪声电平为上述第4阈值以上时,选择第2判断单元。

也可以是,辅音判断部还包括第3判断单元,提取上述相邻的频带间的各频带平均能量中高频的频带的各频带平均能量比相邻的低频的频带的各频带平均能量大的组合,将提取的上述组合之间进行比较,对高频的频带的各频带平均能量比相邻的低频的频带的各频带平均能量大的组合的个数进行计数,当计数的计数值为预先确定的第3阈值以上时,判断为含有辅音,判断选择部在通过上述第2判断单元未判断辅音时,选择上述第3判断单元。

为解决上述课题,本发明的辅音区间检测方法的特征在于,以预先确定的帧单位截取输入信号,生成帧化输入信号,将帧化输入信号从时间区域变换为频率区域,生成集中了每个频率的频谱的频谱图,导出上述频谱图中的、连续的预先确定的每个带宽的平均能量即各频带平均能量,将导出的各频带平均能量之间进行比较,越高频带的各频带平均能量成为越高的能量时,判断帧化输入信号中含有辅音。

如上所述,在本发明中,在较高的噪声电平的环境下也可高精度地检测出辅音区间。

附图说明

图1是用于说明辅音区间的说明图。

图2是用于说明辅音区间的说明图。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于JVC建伍株式会社,未经JVC建伍株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210022303.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top