[发明专利]基于弧长的语音信号端点检测方法有效

申请号：	201711155073.8	申请日：	2017-11-20
公开（公告）号：	CN107833582B	公开（公告）日：	2021-02-09
发明（设计）人：	蒋晔	申请（专利权）人：	南京财经大学
主分类号：	G10L25/78	分类号：	G10L25/78;G10L25/03
代理公司：	南京理工大学专利中心 32203	代理人：	王玮
地址：	210023 江***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于语音信号端点检测方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种基于弧长的语音信号端点检测方法。首先计算语音信号的短时弧长，然后设置一个阈值，根据阈值将语音信号划分为有声段和无声段，最后，将所有有声段所对应的起、止位置成对组成数组，作为端点检测的最终结果输出，完成语音端点检测。本发明的计算量较少，参数调节和优化也较为方便，特别适用于语音编、解码和信号传输等对实时性要求较高的场合。

技术领域

本发明属于语音信号处理领域，具体是一种基于弧长的语音信号端点检测方法。

背景技术

语音信号可以分为有声段和无声段，在语音信号编码、语音识别和说话人识别系统中，无声段的混入会显著降低系统的工作效率与性能。因此，在语音信号处理阶段，需要将相应的有声段起止点检测出来，即语音信号的端点检测技术。

近年来，研究者提出了多种语音信号端点检测方法，如基于短时能量的方法、基于短时能量和短时过零率相结合的双门限法、基于谱熵的方法、基于梅尔倒谱相似度的方法、基于子带信噪比的方法等。在这些端点检测方法中，大多原理复杂，计算耗时，参数过多，不方便调节优化，也不利于信号的高速、实时处理。以最简单，也是最常用的基于短时能量和短时过零率相结合的双门限法为例，该方法以短时能量为主，短时过零率为辅，需要同时计算语音信号的短时能量及短时过零率；然后对短时能量设置两个阈值，对短时过零率设置一个阈值，采用多阈值逻辑进行综合判断。与双门限法相比，上述其它语音端点检测方法的复杂度更高，处理起来更为耗时。

发明内容

本发明的目的在于提供一种基于弧长的语音信号端点检测方法，用来克服其它语音端点检测方法复杂度较高、处理耗时的问题。

实现本发明目的的技术解决方案为：一种基于弧长的语音信号端点检测方法，首先计算语音信号的短时弧长，然后设置一个阈值，根据阈值将语音信号划分为有声段和无声段，最后将有声段作为结果输出，完成语音端点检测。

检测方法的流程包括如下步骤：

(1)分帧

将语音信号采样序列划分为一系列固定长度的帧；

(2)按帧计算弧长

对每帧信号，计算其弧长，即短时弧长；

(3)设定阈值

根据短时弧长的平均值，取其平均值的5％作为阈值；

(4)初步检测

根据步骤(3)设定的阈值，对所有帧进行比较。将短时弧长大于或等于阈值的语音帧，标记为有声段，用“1”表示；其余帧标记为无声段，用“0”表示；