[发明专利]一种低信噪比下语音端点检测方法无效
申请号: | 201310019031.7 | 申请日: | 2013-01-19 |
公开(公告)号: | CN103117067A | 公开(公告)日: | 2013-05-22 |
发明(设计)人: | 王健;韩志艳 | 申请(专利权)人: | 渤海大学 |
主分类号: | G10L25/87 | 分类号: | G10L25/87;G10L25/84;G10L15/20 |
代理公司: | 锦州辽西专利事务所 21225 | 代理人: | 李辉 |
地址: | 121000 辽宁省*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种低信噪比下语音端点检测方法,其包括:语音信号预处理、短时能零积计算、子带能量鉴别信息计算、噪声更新因子计算及帧判决。综合短时能量积和鉴别信息的互补优势,首先利用短时能零积进行判决,当遇到噪声帧与语音帧的转折帧时,再利用基于子带能量鉴别信息的方法进行复检,因此避免了因噪声幅度急剧变化和结尾语音帧被噪声淹没而导致的误检。与现有方法相比,即使在信噪比变化剧烈的情况下仍能准确快速地检测出语音的起止点,对语音信号的后续研究起了很好的铺垫作用。 | ||
搜索关键词: | 一种 低信噪 语音 端点 检测 方法 | ||
【主权项】:
1.一种低信噪比环境下的语音端点检测方法,其特征是:包括以下步骤:(1)、语音信号预处理通过麦克风输入语音信号,由处理单元采样量化后获得相应语音数据,然后进行预加重、分帧和加窗处理;(2)、短时能零积计算第
帧的短时平均能量
和短时平均过零率
之积称为第
帧语音信号的短时能零积
:
其中,
表示语音信号的第
帧;
,
是加汉明窗或矩形窗的语音信号,
为帧长;
;(3)、子带能量鉴别信息计算鉴别信息是用来衡量当前帧频谱分布与噪声帧频谱分布相似程度的,并采用子带能量分布代替概率分布,
假设当前帧为噪声帧,
假设当前帧为语音帧,鉴别信息
为对数
在假设
下的期望,即
其中,
表示噪声帧中第
个子带能量所占总能量的比例;
表示当前帧中第
个子带能量所占总能量的比例;
为划分的子带个数,
=8~12;(4)、噪声更新因子计算利用获得的鉴别信息来计算噪声更新因子
:
其中,
是常数,取值范围分别为0.8~0.9,0.2~0.3,0.2~0.3;
是一个计数值,代表到当前帧为止
的连续帧的数目;(5)、帧判决取待判决语音数据前5帧作为无音片段进行处理,并规定待判决语音数据的第一帧认为是噪声帧;将计算出的每帧短时能零积与噪声门限阈值进行比较,所述噪声门限阈值按下式进行更新:
其中,
代表经过第帧更新后噪声的门限阈值,
代表经过第
帧更新后噪声的门限阈值,
为噪声更新因子;用短时能零积法进行判决过程中当遇到噪声帧与语音帧的转折帧时,采用基于子带能量鉴别信息的方法再次进行判决,其整个判决过程如下:1)如果前一帧被判为噪声帧,且当前帧
,则此帧继续为噪声帧;2)如果前一帧被判为噪声帧,且当前帧
且
,则记录该帧位置为start,然后继续计算比较后面连续6帧,如果都满足
且
,则认为start为语音的起点,否则仍为噪声帧;其中
为鉴别信息判决边界,是距离当前帧最近的五帧噪声的鉴别信息平均值;3)如果前一帧被判为语音帧,且当前帧
,则该帧继续为语音帧;4)如果前一帧被判为语音帧,且当前帧
且
,则记录该帧位置为end,然后继续计算比较后面4帧,如果都满足
且
,则认为end为语音的终点,否则仍为语音帧;5)每判决完一帧都要通过加权对噪声门限阈值进行更新:
6)如果已经取完最后一帧,就结束语音的端点检测,否则继续进行上面的操作。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于渤海大学,未经渤海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310019031.7/,转载请声明来源钻瓜专利网。