[发明专利]基于弧长的语音信号端点检测方法有效
申请号: | 201711155073.8 | 申请日: | 2017-11-20 |
公开(公告)号: | CN107833582B | 公开(公告)日: | 2021-02-09 |
发明(设计)人: | 蒋晔 | 申请(专利权)人: | 南京财经大学 |
主分类号: | G10L25/78 | 分类号: | G10L25/78;G10L25/03 |
代理公司: | 南京理工大学专利中心 32203 | 代理人: | 王玮 |
地址: | 210023 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 语音 信号 端点 检测 方法 | ||
本发明公开了一种基于弧长的语音信号端点检测方法。首先计算语音信号的短时弧长,然后设置一个阈值,根据阈值将语音信号划分为有声段和无声段,最后,将所有有声段所对应的起、止位置成对组成数组,作为端点检测的最终结果输出,完成语音端点检测。本发明的计算量较少,参数调节和优化也较为方便,特别适用于语音编、解码和信号传输等对实时性要求较高的场合。
技术领域
本发明属于语音信号处理领域,具体是一种基于弧长的语音信号端点检测方法。
背景技术
语音信号可以分为有声段和无声段,在语音信号编码、语音识别和说话人识别系统中,无声段的混入会显著降低系统的工作效率与性能。因此,在语音信号处理阶段,需要将相应的有声段起止点检测出来,即语音信号的端点检测技术。
近年来,研究者提出了多种语音信号端点检测方法,如基于短时能量的方法、基于短时能量和短时过零率相结合的双门限法、基于谱熵的方法、基于梅尔倒谱相似度的方法、基于子带信噪比的方法等。在这些端点检测方法中,大多原理复杂,计算耗时,参数过多,不方便调节优化,也不利于信号的高速、实时处理。以最简单,也是最常用的基于短时能量和短时过零率相结合的双门限法为例,该方法以短时能量为主,短时过零率为辅,需要同时计算语音信号的短时能量及短时过零率;然后对短时能量设置两个阈值,对短时过零率设置一个阈值,采用多阈值逻辑进行综合判断。与双门限法相比,上述其它语音端点检测方法的复杂度更高,处理起来更为耗时。
发明内容
本发明的目的在于提供一种基于弧长的语音信号端点检测方法,用来克服其它语音端点检测方法复杂度较高、处理耗时的问题。
实现本发明目的的技术解决方案为:一种基于弧长的语音信号端点检测方法,首先计算语音信号的短时弧长,然后设置一个阈值,根据阈值将语音信号划分为有声段和无声段,最后将有声段作为结果输出,完成语音端点检测。
检测方法的流程包括如下步骤:
(1)分帧
将语音信号采样序列划分为一系列固定长度的帧;
(2)按帧计算弧长
对每帧信号,计算其弧长,即短时弧长;
(3)设定阈值
根据短时弧长的平均值,取其平均值的5%作为阈值;
(4)初步检测
根据步骤(3)设定的阈值,对所有帧进行比较。将短时弧长大于或等于阈值的语音帧,标记为有声段,用“1”表示;其余帧标记为无声段,用“0”表示;
(5)结果优化
将很短的有声段,即前后连续标为“1”且连续帧数小于某固定值的段所对应帧,重新标记为无声段,即标为“0”;
(6)结果输出
将所有有声段所对应的起、止位置成对组成数组,作为端点检测的最终结果输出。
本发明与现有技术相比,其显著优点:本发明是基于短时弧长的检测,计算量更小,实现更为简单。特别适用于语音编、解码和信号传输等对实时性要求较高的场合。
附图说明
图1为本发明基于弧长的语音信号端点检测的流程图。
图2为样例语音信号的波形。
图3为样例语音信号的弧长曲线。
图4为样例语音信号的弧长阈值设置图。
图5为样例语音信号的语音端点检测初步结果。
图6为样例语音信号的语音端点检测优化结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京财经大学,未经南京财经大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711155073.8/2.html,转载请声明来源钻瓜专利网。