[发明专利]用于检测语音段的方法无效

专利信息
申请号: 201080050560.8 申请日: 2010-10-07
公开(公告)号: CN102687196A 公开(公告)日: 2012-09-19
发明(设计)人: 卡洛斯·加西亚马丁内斯;海伦卡·杜先斯巴罗贝斯;毛里西奥·赛德拉维申斯;大卫·卡德纳斯桑切斯 申请(专利权)人: 西班牙电信公司
主分类号: G10L11/02 分类号: G10L11/02;G10L15/14
代理公司: 北京集佳知识产权代理有限公司 11227 代理人: 王萍;李春晖
地址: 西班牙*** 国省代码: 西班牙;ES
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明涉及一种用于检测数字音频输入信号中的噪音段和语音段的方法,所述输入信号被分为多个帧,本方法包括:第一阶段(10),其中,如果帧与之前N个帧的平均能量值不大于第一能量阈值,则进行将所述帧并分类成噪音的第一分类,N>1;第二阶段(20),其中,针对在第一阶段中没有被分类成噪音的每个帧,基于结合至少第一标准、第二标准和第三标准来判定将所述帧分类为噪音还是分类为语音,第一标准是关于帧与声学的噪音模型和语音模型的频谱相似性,第二标准是关于对帧的能量的分析,而第三标准是关于持续时间,包括:使用状态机,用于根据对声学相似性大于第一声学阈值的确定数目的连续帧的累加来检测段的开始,以及用于检测所述段的结束;第三阶段(30),其中,使用关于持续时间的标准来审查在第二阶段中进行的将信号帧分类成语音或分类成噪音的分类。
搜索关键词: 用于 检测 语音 方法
【主权项】:
一种用于检测数字音频输入信号中的噪音段和语音段(2)的方法,所述输入信号被分为多个帧(1),所述方法包括:‑第一阶段(10),其中,如果帧与之前N个帧的平均能量值不大于第一能量阈值(threshold_energ1),则进行将所述帧分类成噪音的第一分类,N为大于1的整数;‑第二阶段(20),其中,针对在所述第一阶段中没有被分类成噪音的每个帧,基于结合至少第一标准、第二标准和第三标准来判定将所述帧分类为噪音还是分类为语音,所述第一标准是关于帧与声学的噪音模型和语音模型的频谱相似性,所述第二标准是关于相对于第二能量阈值(threshold_energ2)对所述帧的能量的分析,而所述第三标准是关于持续时间,包括:使用状态机,用于根据对声学相似性大于第一声学阈值(threshold_ac1)的确定数目的连续帧的累加来检测段的开始,以及用于根据声学相似性小于所述第一声学阈值的另一确定数目的连续帧的累加来检测所述段的结束;‑第三阶段(30),其中,使用持续时间的标准来审查在所述第二阶段中进行的将所述信号帧分类成语音或分类成噪音的所述分类,将持续时间小于第一最小段持续时间阈值的语音段、以及不包括确定数目的同时超过所述声学阈值和所述第二能量阈值的连续帧的语音段分类成噪音。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西班牙电信公司,未经西班牙电信公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201080050560.8/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top