[发明专利]基于五门限的声音端点检测方法及其应用在审
申请号: | 201711225920.3 | 申请日: | 2017-11-29 |
公开(公告)号: | CN107993649A | 公开(公告)日: | 2018-05-04 |
发明(设计)人: | 艾竹轩 | 申请(专利权)人: | 无锡同芯微纳科技有限公司 |
主分类号: | G10L15/05 | 分类号: | G10L15/05 |
代理公司: | 南京艾普利德知识产权代理事务所(特殊普通合伙)32297 | 代理人: | 陆明耀,顾祥安 |
地址: | 214000 江苏省无锡市新吴区震*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 门限 声音 端点 检测 方法 及其 应用 | ||
1.基于五门限的声音端点检测方法,其特征在于:包括如下步骤:
S1,接收分帧预处理后的声音信号;
S2,判断一帧信号的平均帧能量差与平均帧能量差低门限、平均帧能量差高门限的大小以及平均帧过零率与平均帧过零率低门限的大小;
S3,当判断第一帧信号的平均帧能量差>平均帧能量差高门限,则该帧信号进入有效音段,音乐长度加1,执行S4步骤;
当判断第一帧信号的平均帧能量差<平均帧能量差低门限和/或平均帧过零率<平均帧过零率低门限,则该帧信号处于静音段,执行S7步骤;
当判断第一帧信号满足平均帧能量差低门限≤平均帧能量差≤平均帧能量差高门限,且平均帧过零率≥平均帧过零率低门限,则该帧信号处于过渡段,执行S8步骤;
S4,判断下一帧信号的平均帧能量差和平均帧过零率小于零是否成立;若不成立,该帧信号还处于有效音段,音乐长度加1,执行S4步骤;若成立,执行S5步骤;
S5,判断该帧信号前的音乐长度是否大于最小音乐长度,若小于,则前面检测出的有效音段是噪音,音乐长度清零,按照S2步骤继续判断下一帧信号的状态;若大于等于,则满足跳变条件,执行S6步骤;
S6,判断下一帧信号的平均帧能量差≥平均帧能量差低门限是否成立;若否,该帧信号处于静音段,执行S7步骤,若是,该帧信号处于过渡段,执行S8步骤;
S7,依照S2步骤判断下一帧信号的状态,并根据S3步骤的判断原则确定该帧的状态;
S8,依照S2步骤判断下一帧信号的状态,当该帧信号不满足平均帧能量差低门限≤平均帧能量差≤平均帧能量差高门限,且平均帧过零率≥平均帧过零率低门限,该帧信号维持在静音段,执行S7步骤;
当该帧信号满足平均帧能量差低门限≤平均帧能量差≤平均帧能量差高门限,且平均帧过零率≥平均帧过零率低门限时,执行S9步骤;
S9,判断该帧信号与前一帧信号的平均帧能量差之和大于平均帧能量差步长且该帧信号与前一帧信号的平均帧过零率的绝对值之和大于平均帧过零率步长是否成立;若不成立,该帧信号维持在过渡段,执行S8步骤;若成立,该帧信号进入有效音段,音乐长度加1,执行S4步骤。
2.根据权利要求1所述的基于五门限的声音端点检测方法,其特征在于:在S1步骤中,按照帧长441,帧移441对声音信号进行分帧。
3.根据权利要求1所述的基于五门限的声音端点检测方法,其特征在于:在S2步骤中,一帧信号的平均帧能量差经过归一化处理。
4.根据权利要求1所述的基于五门限的声音端点检测方法,其特征在于:在S2步骤中,所述平均帧能量差低门限在0.030-0.055之间,所述平均帧能量差高门限在0.040-0.085之间,所述平均帧过零率低门限在0-0.005之间。
5.根据权利要求1所述的基于五门限的声音端点检测方法,其特征在于:在S3步骤中,当从一帧信号开始进入有效音段,记录该帧信号的帧数f,并根据如下公式,确定该帧信号对应的有效音段的起始时间
t=(f*ins+ FrameLen -ins)/采样频率
其中,t为有效音段的起始时间,f为进入每个有效音段的起始帧信号的帧数,FrameLen为帧长,ins为帧移。
6.根据权利要求1所述的基于五门限的声音端点检测方法,其特征在于:在S9步骤中,所述平均帧能量差步长在0.070-0.100之间,所述平均帧过零率步长在0.300-2.000之间。
7.根据权利要求1-6任一所述的基于五门限的声音端点检测方法,其特征在于:至少用于将包含乐器演音乐的声音信号切分成一组单音符的音乐段。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于无锡同芯微纳科技有限公司,未经无锡同芯微纳科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711225920.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种无人机识别方法、装置及电子设备
- 下一篇:用于生成信息的方法和装置