[发明专利]基于五门限的声音端点检测方法及其应用在审
申请号: | 201711225920.3 | 申请日: | 2017-11-29 |
公开(公告)号: | CN107993649A | 公开(公告)日: | 2018-05-04 |
发明(设计)人: | 艾竹轩 | 申请(专利权)人: | 无锡同芯微纳科技有限公司 |
主分类号: | G10L15/05 | 分类号: | G10L15/05 |
代理公司: | 南京艾普利德知识产权代理事务所(特殊普通合伙)32297 | 代理人: | 陆明耀,顾祥安 |
地址: | 214000 江苏省无锡市新吴区震*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明揭示了基于五门限的声音端点检测方法,通过判断一帧信号的平均帧能量差与平均帧能量差低门限、平均帧能量差高门限的大小以及平均帧过零率与平均帧过零率低门限的大小来确定其处于静音段、过渡段或有效音段,在过渡段后结合平均帧能量差步长及平均帧过零率步长来判断是否进入有效音段,以及在有效音段后,判断不在有效音段后信号所在的状态。本方法引入短时平均能量差作为判别的条件,增加了平均帧能量差步长、平均帧过零率步长作为在过渡段之后判断是否进入有效音段的条件,提高了对进入有效音段的要求,各门限的设定,提高了端点检测的准确性,另外,通过对有效音段结束后跳变到的状态进行判断,也有利于保证后续有效音段检测的精确性。 | ||
搜索关键词: | 基于 门限 声音 端点 检测 方法 及其 应用 | ||
【主权项】:
基于五门限的声音端点检测方法,其特征在于:包括如下步骤:S1,接收分帧预处理后的声音信号;S2,判断一帧信号的平均帧能量差与平均帧能量差低门限、平均帧能量差高门限的大小以及平均帧过零率与平均帧过零率低门限的大小;S3,当判断第一帧信号的平均帧能量差>平均帧能量差高门限,则该帧信号进入有效音段,音乐长度加1,执行S4步骤;当判断第一帧信号的平均帧能量差<平均帧能量差低门限和/或平均帧过零率<平均帧过零率低门限,则该帧信号处于静音段,执行S7步骤;当判断第一帧信号满足平均帧能量差低门限≤平均帧能量差≤平均帧能量差高门限,且平均帧过零率≥平均帧过零率低门限,则该帧信号处于过渡段,执行S8步骤;S4,判断下一帧信号的平均帧能量差和平均帧过零率小于零是否成立;若不成立,该帧信号还处于有效音段,音乐长度加1,执行S4步骤;若成立,执行S5步骤;S5,判断该帧信号前的音乐长度是否大于最小音乐长度,若小于,则前面检测出的有效音段是噪音,音乐长度清零,按照S2步骤继续判断下一帧信号的状态;若大于等于,则满足跳变条件,执行S6步骤;S6,判断下一帧信号的平均帧能量差≥平均帧能量差低门限是否成立;若否,该帧信号处于静音段,执行S7步骤,若是,该帧信号处于过渡段,执行S8步骤;S7,依照S2步骤判断下一帧信号的状态,并根据S3步骤的判断原则确定该帧的状态;S8,依照S2步骤判断下一帧信号的状态,当该帧信号不满足平均帧能量差低门限≤平均帧能量差≤平均帧能量差高门限,且平均帧过零率≥平均帧过零率低门限,该帧信号维持在静音段,执行S7步骤;当该帧信号满足平均帧能量差低门限≤平均帧能量差≤平均帧能量差高门限,且平均帧过零率≥平均帧过零率低门限时,执行S9步骤;S9,判断该帧信号与前一帧信号的平均帧能量差之和大于平均帧能量差步长且该帧信号与前一帧信号的平均帧过零率的绝对值之和大于平均帧过零率步长是否成立;若不成立,该帧信号维持在过渡段,执行S8步骤;若成立,该帧信号进入有效音段,音乐长度加1,执行S4步骤。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于无锡同芯微纳科技有限公司,未经无锡同芯微纳科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711225920.3/,转载请声明来源钻瓜专利网。
- 上一篇:一种无人机识别方法、装置及电子设备
- 下一篇:用于生成信息的方法和装置