[发明专利]噪声环境下语音端点的检测方法在审
申请号: | 201710255549.9 | 申请日: | 2017-04-19 |
公开(公告)号: | CN106991998A | 公开(公告)日: | 2017-07-28 |
发明(设计)人: | 林海波;程吕鹏 | 申请(专利权)人: | 重庆邮电大学 |
主分类号: | G10L15/04 | 分类号: | G10L15/04;G10L21/02;G10L25/45;G10L25/84;G10L25/87 |
代理公司: | 重庆蕴博君晟知识产权代理事务所(普通合伙)50223 | 代理人: | 王玉芝,田东阳 |
地址: | 400065 重*** | 国省代码: | 重庆;85 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 噪声 环境 语音 端点 检测 方法 | ||
1.一种噪声环境下语音端点的检测方法,包括:
步骤1:根据人耳的基底膜的听觉特性将20~22050Hz的频率范围分成25个频率群;
步骤2:计算与每个频率群相对应的不等带宽子带的方差Di;
步骤3:根据计算出的频率群的不等带宽子带的方差Di,通过单参数双门限法检测语音信号的起止端点。
2.如权利要求1所述的噪声环境下语音端点的检测方法,其中,每个频率群中的中心频率、临界带宽、下限频率和上限频率分别代表一项参数,且所述中心频率、所述下限频率和所述上限频率被构成一个3×25维的数组。
3.如权利要求2所述的噪声环境下语音端点的检测方法,其中,在计算每个频率群的不等带宽子带的方差的过程中,包括:
步骤21:根据语音信号x(n)的采样频率fs,求出在(0~fs/2)频率区间内的不等带宽子带的数量q;
步骤22:对所述语音信号x(n)进行加窗分帧处理得到第i帧的语音信号xi(m),经快速傅氏变换后得到(N/2+1)条正频率幅值谱线Xi,Xi={Xi(1),Xi(2),...,Xi(N/2+1)},i=0,1,2,...,N为帧长;
步骤23:通过内插的方法对(N/2+1)条正频率幅值谱线Xi进行扩展;
步骤24:计算每个不等带宽子带内频谱的平均幅值Ei(j):
式中,fj,l——第j个不等带宽子带的低频临界带宽;
fj,h——第j个不等带宽子带的高频临界带宽;
步骤25:计算(0~fs/2)频率区间内q个不等带宽子带的均值计算公式为:
步骤26:根据所述与所述Ei(j)计算q个不等带宽子带的方差Di,计算公式为:
4.如权利要求1所述的噪声环境下语音端点的检测方法,其中,在根据计算出的频率群的不等带宽子带的方差,通过单参数双门限法检测语音信号的起止端点的过程中,包括:
步骤31:根据所述语音信号的前导无话段计算噪声段的平均方差值,并可设置阈值T1和T2;
步骤32:根据所述阈值T1和所述阈值T2,通过所述单参数双门限法检测语音信号的起止位置。
5.如权利要求4所述的噪声环境下语音端点的检测方法,其中,在根据所述阈值T1和所述阈值T2,通过所述单参数双门限法检测语音信号的起止位置的过程中,当所述Di高于所述阈值T1时,判断为所述语音信号的起点,当所述Di高于所述阈值T2时,判断为所述语音信号的端点;其中,所述阈值T1和所述阈值T2取所述Di的原始数据上的数值或取所述Di的原始数据经过平滑处理后的数值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710255549.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种真空隔热排气消音器
- 下一篇:语音识别方法及装置