[发明专利]噪声环境下语音端点的检测方法在审
申请号: | 201710255549.9 | 申请日: | 2017-04-19 |
公开(公告)号: | CN106991998A | 公开(公告)日: | 2017-07-28 |
发明(设计)人: | 林海波;程吕鹏 | 申请(专利权)人: | 重庆邮电大学 |
主分类号: | G10L15/04 | 分类号: | G10L15/04;G10L21/02;G10L25/45;G10L25/84;G10L25/87 |
代理公司: | 重庆蕴博君晟知识产权代理事务所(普通合伙)50223 | 代理人: | 王玉芝,田东阳 |
地址: | 400065 重*** | 国省代码: | 重庆;85 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 噪声 环境 语音 端点 检测 方法 | ||
技术领域
本发明涉及语音信号处理技术领域,更为具体地,涉及一种噪声环境下语音端点的检测方法。
背景技术
语音端点检测是语音识别中一个重要的缓解,语音端点检测能够对语音信号进行更好的分析和训练,从而提高语音识别的识别率。现有的端点检测算法如利用过零率、短时能量和自相关参数,在高信噪比环境下可以获得较好的检测效果,但在低信噪比环境下其检测性能却急剧下降。
当语音信号包含有背景噪音时,从中检测出语音信号的起始点和终止点,可以减少数据的采集量,删除不含语音信号的背景噪声和无声段,从而降低特征提取的计算量和处理时间,提高语音识别的准确性。
因此,噪声环境中准确的检测语音的起止点有利于提高语音系统性能。当语音中含有噪音时,现有的语音端点检测方法显得有些无能为力。
发明内容
鉴于上述问题,本发明的目的是提供一种噪声环境下语音端点的检测方法,以解决现有的语音端点检测方法在低信噪比环境下其检测性能低的问题。
本发明提供的噪声环境下语音端点的检测方法,包括:
步骤1:根据人耳的基底膜的听觉特性将20~22050Hz的频率范围分成25个频率群;
步骤2:计算与每个频率群相对应的不等带宽子带的方差Di;
步骤3:根据计算出的频率群的不等带宽子带的方差Di,通过单参数双门限法检测语音信号的起止端点。
本发明利用人耳的听觉特性和频带方差对语音能量的起伏的敏感度来进行语音端点的检测,方法简便,检测的准确率更高。
为了实现上述以及相关目的,本发明的一个或多个方面包括后面将详细说明的特征。下面的说明以及附图详细说明了本发明的某些示例性方面。然而,这些方面指示的仅仅是可使用本发明的原理的各种方式中的一些方式。此外,本发明旨在包括所有这些方面以及它们的等同物。
附图说明
通过参考以下结合附图的说明,并且随着对本发明的更全面理解,本发明的其它目的及结果将更加明白及易于理解。在附图中:
图1为根据本发明实施示例的噪声环境下语音端点的检测方法的流程示意图;
图2为根据本发明实施示例的单参数双门限端点检测一级判决示意图;
图3为根据本发明实施示例的不等带宽子带方差端点检测结果图。
具体实施方式
本发明的整体思路为:语音与噪声在频谱域中的差别很大,一般有话段的能量会随频带产生较大的变化,在共振峰处有较大的峰值,在其他的频段能量较小;而噪声段的能量数值相对较小,且在频带内的分布较为均匀,即变相对平缓。可根据这个特性来辨别有有话段与噪声段,产生的“频带方差”可以很好的检测出语音的有话段。
图1示出了根据本发明实施示例的噪声环境下语音端点的检测方法的流程。
如图1所示,本发明提供的噪声环境下语音端点的检测方法,包括如下步骤:
步骤1:根据人耳的基底膜的听觉特性将20~22050Hz的频率范围分成25个频率群。
每个频率群对应一个不等带宽子带,且每个频率群中的中心频率、临界带宽、下限频率和上限频率分别代表一项参数,且中心频率、下限频率和上限频率被构成一个3×25维的数组。如表1所示:
步骤2:计算与每个频率群相对应的不等带宽子带的方差Di。
计算与每个频率群相对应的不等带宽子带的方差Di的过程为:
步骤21:根据语音信号x(n)的采样频率fs,求出在(0~fs/2)频率区间内的不等带宽子带的数量q。
由于在0~22050Hz的范围内有25个不等带宽子带,但一般采样频率可能极低,它只能含有少于25个不等带宽子带,例如语音信号的采样频率是8kHz,通过比较可知,在4kHz的范围内只有17个不等带宽子带,因此,在求取不等带宽子带方差时,只需计算这17个子带的方差即可,从而大幅度地减少计算量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710255549.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种真空隔热排气消音器
- 下一篇:语音识别方法及装置