[发明专利]用于检测语音段的方法无效
申请号: | 201080050560.8 | 申请日: | 2010-10-07 |
公开(公告)号: | CN102687196A | 公开(公告)日: | 2012-09-19 |
发明(设计)人: | 卡洛斯·加西亚马丁内斯;海伦卡·杜先斯巴罗贝斯;毛里西奥·赛德拉维申斯;大卫·卡德纳斯桑切斯 | 申请(专利权)人: | 西班牙电信公司 |
主分类号: | G10L11/02 | 分类号: | G10L11/02;G10L15/14 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王萍;李春晖 |
地址: | 西班牙*** | 国省代码: | 西班牙;ES |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 检测 语音 方法 | ||
1.一种用于检测数字音频输入信号中的噪音段和语音段(2)的方法,所述输入信号被分为多个帧(1),所述方法包括:
-第一阶段(10),其中,如果帧与之前N个帧的平均能量值不大于第一能量阈值(threshold_energ1),则进行将所述帧分类成噪音的第一分类,N为大于1的整数;
-第二阶段(20),其中,针对在所述第一阶段中没有被分类成噪音的每个帧,基于结合至少第一标准、第二标准和第三标准来判定将所述帧分类为噪音还是分类为语音,所述第一标准是关于帧与声学的噪音模型和语音模型的频谱相似性,所述第二标准是关于相对于第二能量阈值(threshold_energ2)对所述帧的能量的分析,而所述第三标准是关于持续时间,包括:使用状态机,用于根据对声学相似性大于第一声学阈值(threshold_ac1)的确定数目的连续帧的累加来检测段的开始,以及用于根据声学相似性小于所述第一声学阈值的另一确定数目的连续帧的累加来检测所述段的结束;
-第三阶段(30),其中,使用持续时间的标准来审查在所述第二阶段中进行的将所述信号帧分类成语音或分类成噪音的所述分类,将持续时间小于第一最小段持续时间阈值的语音段、以及不包括确定数目的同时超过所述声学阈值和所述第二能量阈值的连续帧的语音段分类成噪音。
2.根据权利要求1所述的方法,其中,在所述第三阶段中使用了两个持续时间阈值:
-第一最小段持续时间阈值(threshold_dur1),或者被分类成语音或被分类成噪音的连续帧的最小数目;
-在所述第二阶段中符合所述频谱相似性的标准和帧能量的分析的标准二者的连续帧的第二持续时间阈值(threshold_dur2)。
3.根据权利要求1至2中任一项所述的方法,其中,在所述第二阶段中使用的所述的频谱相似性的标准包括:将所述帧的频谱特性与之前建立的所述声学的噪音模型和语音模型的频谱特性进行比较分析。
4.根据权利要求3所述的方法,其中,使用Viterbi算法进行所述的对频谱特性的比较分析。
5.根据权利要求1至4中任一项所述的方法,其中,之前建立的所述声学的噪音模型和语音模型是通过借助于隐马尔可夫模型分别对两个声学的噪音单元和语音单元进行统计建模而获得的。
6.根据前述权利要求中任一项所述的方法,其中,所述状态机包括至少初始状态(210)、其中检查到语音段已经开始的状态(220)、其中检查到语音段持续的状态(230)以及其中检查到语音段已经结束的状态(240)。
7.根据前述权利要求中任一项所述的方法,其中,在所述第二阶段中,针对在所述第一阶段中没有被分类成噪音的每个帧:
-通过以下方式来计算帧是噪音帧的概率:将所述帧的频谱特性与被分类为噪音但不属于正被分析的信号的一组帧的相同的频谱特性进行比较;
-通过以下方式来计算帧是语音帧的概率:将所述帧的频谱特性与被分类为语音但不属于正被分析的信号的一组帧的相同的频谱特性进行比较;
-根据至少帧是语音帧的概率与帧是噪音帧的概率之间的比,以及所述状态机的当前状态,来计算所述状态机的下一状态。
8.在权利要求7引用权利要求6的情况下根据权利要求7所述的方法,其中,针对其中检查到语音段已经开始的状态(220)与其中检查到语音段持续出现的状态(230)之间的转变,需要如下的至少两个连续的帧:其中帧是语音帧的概率与帧是噪音帧的概率之间的比大于第一声学阈值。
9.在权利要求7从属于权利要求6的情况下根据权利要求7所述的方法或者根据权利要求8所述的方法,其中,为了使检查到语音段已经结束的状态(240)与所述初始状态(210)之间的转变发生,需要如下的至少两个连续的帧:其中帧是语音帧的概率与帧是噪音帧的概率之间的比小于第一声学阈值除以某一因子。
10.根据权利要求1至9中任一项所述的方法,其中,在所述第一阶段中使用的所述第一能量阈值以如下方式被动态地更新:对所述第一能量阈值的当前值以及在所述第二阶段和所述第三阶段中被分类为噪音的帧的能量值加权。
11.根据权利要求1至2所述的方法,其中,对帧的能量进行分析(2203,2303)的标准包括:超过通过将所述第一能量阈值乘以某一因子然后向其加上偏移量而计算的第二能量阈值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西班牙电信公司,未经西班牙电信公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201080050560.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:干酸菜的制作方法
- 下一篇:制动器活塞的制造方法