[发明专利]噪声环境下语音端点的检测方法在审

专利信息
申请号: 201710255549.9 申请日: 2017-04-19
公开(公告)号: CN106991998A 公开(公告)日: 2017-07-28
发明(设计)人: 林海波;程吕鹏 申请(专利权)人: 重庆邮电大学
主分类号: G10L15/04 分类号: G10L15/04;G10L21/02;G10L25/45;G10L25/84;G10L25/87
代理公司: 重庆蕴博君晟知识产权代理事务所(普通合伙)50223 代理人: 王玉芝,田东阳
地址: 400065 重*** 国省代码: 重庆;85
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 噪声 环境 语音 端点 检测 方法
【权利要求书】:

1.一种噪声环境下语音端点的检测方法,包括:

步骤1:根据人耳的基底膜的听觉特性将20~22050Hz的频率范围分成25个频率群;

步骤2:计算与每个频率群相对应的不等带宽子带的方差Di

步骤3:根据计算出的频率群的不等带宽子带的方差Di,通过单参数双门限法检测语音信号的起止端点。

2.如权利要求1所述的噪声环境下语音端点的检测方法,其中,每个频率群中的中心频率、临界带宽、下限频率和上限频率分别代表一项参数,且所述中心频率、所述下限频率和所述上限频率被构成一个3×25维的数组。

3.如权利要求2所述的噪声环境下语音端点的检测方法,其中,在计算每个频率群的不等带宽子带的方差的过程中,包括:

步骤21:根据语音信号x(n)的采样频率fs,求出在(0~fs/2)频率区间内的不等带宽子带的数量q;

步骤22:对所述语音信号x(n)进行加窗分帧处理得到第i帧的语音信号xi(m),经快速傅氏变换后得到(N/2+1)条正频率幅值谱线Xi,Xi={Xi(1),Xi(2),...,Xi(N/2+1)},i=0,1,2,...,N为帧长;

步骤23:通过内插的方法对(N/2+1)条正频率幅值谱线Xi进行扩展;

步骤24:计算每个不等带宽子带内频谱的平均幅值Ei(j):

<mrow><msub><mi>E</mi><mi>i</mi></msub><mrow><mo>(</mo><mi>j</mi><mo>)</mo></mrow><mo>=</mo><mfrac><mn>1</mn><mrow><msub><mi>f</mi><mrow><mi>j</mi><mo>,</mo><mi>h</mi></mrow></msub><mo>-</mo><msub><mi>f</mi><mrow><mi>j</mi><mo>,</mo><mi>l</mi></mrow></msub><mo>+</mo><mn>1</mn></mrow></mfrac><munder><mo>&Sigma;</mo><mrow><msub><mi>f</mi><mrow><mi>j</mi><mo>,</mo><mi>l</mi></mrow></msub><mo>&le;</mo><msub><mi>f</mi><mi>k</mi></msub><mo>&le;</mo><msub><mi>f</mi><mrow><mi>j</mi><mo>,</mo><mi>h</mi></mrow></msub></mrow></munder><mo>|</mo><msub><mi>X</mi><mi>i</mi></msub><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow><mo>|</mo><mo>,</mo><mi>j</mi><mo>=</mo><mn>1</mn><mo>,</mo><mn>2</mn><mo>,</mo><mn>...</mn><mo>,</mo><mi>q</mi><mo>;</mo></mrow>

式中,fj,l——第j个不等带宽子带的低频临界带宽;

fj,h——第j个不等带宽子带的高频临界带宽;

步骤25:计算(0~fs/2)频率区间内q个不等带宽子带的均值计算公式为:

步骤26:根据所述与所述Ei(j)计算q个不等带宽子带的方差Di,计算公式为:

4.如权利要求1所述的噪声环境下语音端点的检测方法,其中,在根据计算出的频率群的不等带宽子带的方差,通过单参数双门限法检测语音信号的起止端点的过程中,包括:

步骤31:根据所述语音信号的前导无话段计算噪声段的平均方差值,并可设置阈值T1和T2;

步骤32:根据所述阈值T1和所述阈值T2,通过所述单参数双门限法检测语音信号的起止位置。

5.如权利要求4所述的噪声环境下语音端点的检测方法,其中,在根据所述阈值T1和所述阈值T2,通过所述单参数双门限法检测语音信号的起止位置的过程中,当所述Di高于所述阈值T1时,判断为所述语音信号的起点,当所述Di高于所述阈值T2时,判断为所述语音信号的端点;其中,所述阈值T1和所述阈值T2取所述Di的原始数据上的数值或取所述Di的原始数据经过平滑处理后的数值。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710255549.9/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top