[发明专利]一种利用短时时频值的自适应端点检测方法在审
申请号: | 201410292519.1 | 申请日: | 2014-06-25 |
公开(公告)号: | CN104021789A | 公开(公告)日: | 2014-09-03 |
发明(设计)人: | 洪青阳;雷文钿;童峰 | 申请(专利权)人: | 厦门大学 |
主分类号: | G10L17/02 | 分类号: | G10L17/02 |
代理公司: | 厦门南强之路专利事务所(普通合伙) 35200 | 代理人: | 马应森 |
地址: | 361005 *** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 利用 时时 自适应 端点 检测 方法 | ||
技术领域
本发明涉及说话人识别系统中的语音检测技术,具体涉及一种利用短时时频值的自适应端点检测方法。
背景技术
语音端点检测技术是说话人识别系统中面临的第一个关键技术。语音信号处理中的端点检测技术是指从包含语音的一段信号中确定出语音的起点和结束点。作为一个完整的说话人识别系统,其最终效果不仅取决于识别算法的优劣,其他许多相关因素都会直接影响着系统应用的成功与否。在说话人识别系统中,处理的对象是语音信号,但是实际环境下的语音信号都存在一定的背景噪声。如何有效地区分背景噪声和语音,并尽可能地去除不含语音成分的背景噪声,提高识别的鲁棒性,是本发明要解决的问题。另外,在实际应用系统中,有效的语音端点检测技术不仅能减少系统的处理时间、提高系统处理的实时性,而且能排除无声段噪声的干扰,从而提高系统的整体性能。因此,端点检测的准确性在一定程度上决定了整个系统的成败。
目前,端点检测大体上可以分为两类:基于模型的检测算法和基于特征的检测算法。
基于模型的方法是以数据统计分析为基础建立一个能够更好刻画语音信号内部联系的模型,常见的有基于隐马尔科夫模型(HMM)、矢量量化(vector quantization,VQ)和支持向量机(support vector machine,SVM)等端点检测方法。该方法过程比较复杂、运算量大,并且实际应用环境复杂多变,噪声多种多样,建立的语音和噪声模型对环境的适应性比较差,检测准确率达不到实际应用的需求。
基于特征的端点检测方法均依据语音信号的时域特性和频域特性。常用的时频域特征主要有短时能量、短时平均过零率、短时信息熵和短时频谱等。然后通过判断这些特征参数是否超过一个阈值,而后再通过“与”和“或”运算来做出是否是语音起止点的判断。
如Lu Lie等人(Lu Lie,Jiang Hao,Zhang Hong-jiang.A robust audio classification and segmentation method[C].Proc.of the 9th ACM International Conference on Multimedia.2001)提出了一种基于时域特征参数端点检测方法——用短时能量变化率来进行端点检测。这种方法采用的不是短时能量而是短时能量的变化率,该方法具有一定的鲁棒性,但不能解决信噪比检测准确率的问题。
如张仁志和崔慧娟(张仁志,崔慧娟.基于短时能量的语音端点检测方法研究[J].电声技术,2005(7):52-54)提出了一种改进的短时能量端点检测方法,在采用短时全带能量为特征的基础上,将短时高频能量作为辅助特征,同时使用了最优边沿检测滤波以及双门限——三态转化判决机制,从而保证该方法在噪声环境下检测的准确性和对信号绝对幅度变化的稳健性,能够在信噪比下保持良好的性能。
如苏伟博(苏伟博.一种语音端点检测方法及装置.天津市亚安科技电子有限公司,CN 102097095A,2011)提出的一种语音端点检测方法及装置。该发明专利中应用了频谱熵作为语音和非语音的区分特征,可以有效的区分语音帧和非语音帧。对于低信噪比环境也有较好的检测结果。
在实际应用中,往往综合时域和频域的几种特征参数来进行端点检测,如郭继云等人(郭继云,王守觉,刘学刚.一种改进的基于能频比的端点检测算法[J].计算机工程与应用,2005,41(29):91-93)提出的一种改进的基于能频比的端点检测算法。该方法结合时域和频域的特征参数,发挥各自特征参数优势的同时还规避了自身的不足。
如李祺、马华东等人(李祺,马华东,郑侃彦等.一种自适应的语音端点检测方法.新奥特(北京)视频技术有限公司,CN 101625857A,2010)提出的一种自适应的语音端点检测方法。该发明专利利用了短时能量、短时平均过零率和短时信息熵三个音频特征参数,有效的结合了时域和频域的特征参数,并能够根据背景噪声的变化做出及时的反馈,从而提高在复杂噪声背景下的语音端点检测效率。所以将时频特征参数相结合能得到很好的效果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门大学,未经厦门大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410292519.1/2.html,转载请声明来源钻瓜专利网。