[发明专利]一种低信噪比下语音端点检测方法无效
申请号: | 201310019031.7 | 申请日: | 2013-01-19 |
公开(公告)号: | CN103117067A | 公开(公告)日: | 2013-05-22 |
发明(设计)人: | 王健;韩志艳 | 申请(专利权)人: | 渤海大学 |
主分类号: | G10L25/87 | 分类号: | G10L25/87;G10L25/84;G10L15/20 |
代理公司: | 锦州辽西专利事务所 21225 | 代理人: | 李辉 |
地址: | 121000 辽宁省*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 低信噪 语音 端点 检测 方法 | ||
1.一种低信噪比环境下的语音端点检测方法,其特征是:包括以下步骤:
(1)、语音信号预处理
通过麦克风输入语音信号,由处理单元采样量化后获得相应语音数据,然后进行预加重、分帧和加窗处理;
(2)、短时能零积计算
第 帧的短时平均能量和短时平均过零率之积称为第帧语音信号的短时能零积:
其中,表示语音信号的第帧;,是加汉明窗或矩形窗的语音信号, 为帧长;;
(3)、子带能量鉴别信息计算
鉴别信息是用来衡量当前帧频谱分布与噪声帧频谱分布相似程度的,并采用子带能量分布代替概率分布,假设当前帧为噪声帧,假设当前帧为语音帧,鉴别信息为对数在假设下的期望,即
其中,表示噪声帧中第个子带能量所占总能量的比例;表示当前帧中第个子带能量所占总能量的比例;为划分的子带个数,=8~12;
(4)、噪声更新因子计算
利用获得的鉴别信息来计算噪声更新因子:
其中,是常数,取值范围分别为0.8~0.9,0.2~0.3,0.2~0.3;是一个计数值,代表到当前帧为止的连续帧的数目;
(5)、帧判决
取待判决语音数据前5帧作为无音片段进行处理,并规定待判决语音数据的第一帧认为是噪声帧;
将计算出的每帧短时能零积与噪声门限阈值进行比较,所述噪声门限阈值按下式进行更新:
其中,代表经过第帧更新后噪声的门限阈值,代表经过第帧更新后噪声的门限阈值,为噪声更新因子;
用短时能零积法进行判决过程中当遇到噪声帧与语音帧的转折帧时,采用基于子带能量鉴别信息的方法再次进行判决,其整个判决过程如下:
1)如果前一帧被判为噪声帧,且当前帧,则此帧继续为噪声帧;
2)如果前一帧被判为噪声帧,且当前帧且,则记录该帧位置为start,然后继续计算比较后面连续6帧,如果都满足且,则认为start为语音的起点,否则仍为噪声帧;
其中为鉴别信息判决边界,是距离当前帧最近的五帧噪声的鉴别信息平均值;
3)如果前一帧被判为语音帧,且当前帧,则该帧继续为语音帧;
4)如果前一帧被判为语音帧,且当前帧且,则记录该帧位置为end,然后继续计算比较后面4帧,如果都满足且,则认为end为语音的终点,否则仍为语音帧;
5)每判决完一帧都要通过加权对噪声门限阈值进行更新:
6)如果已经取完最后一帧,就结束语音的端点检测,否则继续进行上面的操作。
2.根据权利要求1所述的低信噪比环境下的语音端点检测方法,其特征是:所述短时能零积计算时,加的是汉明窗,帧长。
3.根据权利要求1所述的低信噪比环境下的语音端点检测方法,其特征是:所述子带能量鉴别信息计算时,子带个数,即将0Hz到5512Hz的全频带分成8个频带,每16个点构成一个频带。
4.根据权利要求1所述的低信噪比环境下的语音端点检测方法,其特征是:所述噪声更新因子计算时,常数的取值分别为。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于渤海大学,未经渤海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310019031.7/1.html,转载请声明来源钻瓜专利网。