[发明专利]一种高效的语音检测方法有效
申请号: | 201310743203.5 | 申请日: | 2013-12-30 |
公开(公告)号: | CN103646649A | 公开(公告)日: | 2014-03-19 |
发明(设计)人: | 陶建华;刘斌 | 申请(专利权)人: | 中国科学院自动化研究所 |
主分类号: | G10L25/78 | 分类号: | G10L25/78 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 宋焰琴 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 高效 语音 检测 方法 | ||
技术领域
本发明涉及智能信息处理领域,尤其是一种高效的语音检测方法。
背景技术
语音是人类交流信息的主要手段之一,语音检测技术一直在语音信号处理领域中占据重要的地位;语音检测系统作为语音识别、说话人识别、语音编码等预处理模块,它的鲁棒性将直接影响着其它语音处理模块的性能。面对各种复杂环境下的随机噪声,如何通过一种高效的手段准确的定位到语音段数据,有效的区分语音和非语音信号,已经成为目前国内外的研究热点,越来越受到广泛关注。语音检测系统具有重大的实用价值,高质量的鲁棒语音检测技术在各种通信系统、多媒体系统、语音识别系统和声纹识别系统中都得到了普遍的应用。
目前主流的语音检测方法主要包括基于参数的语音检测方法和基于模型的语音检测方法。基于参数的语音检测方法从信号层对语音信号进行分析,在时域、频域或其它变换域中计算语音参数,通过设置合理的阈值检测音频流中是否包含语音;常用的语音参数包括短时能量、短时过零率、各频带的能量比重、谐波成分等。基于模型的语音检测方法通过大规模语音数据训练模型,通过智能化的数学模型准确的区分语音信号和各种非语音信号;常用的方法包括基于高斯混合模型的语音检测方法、基于人工神经网络的语音检测方法、基于隐马尔科夫模型的语音检测方法等。基于模型的语音检测方法需要对大规模数据进行标注以训练可靠的语音检测模型,属于有监督的语音检测方法;基于参数的语音检测方法无需训练数学模型,属于无监督的语音检测方法。目前各种主流的语音检测方法,在各种安静环境下可以快速准确的检测到语音信号;在平稳噪声环境下和各种高信噪比的非平稳噪声环境下语音检测系统具有较高的准确率;但是,面对各种复杂环境下的各种非平稳随机噪声,语音检测系统的性能下降严重。
发明内容
为解决上述的一个或多个问题,本发明提供了一种高效的语音检测方法,在各种复杂环境下,能够快速、准确的从音频流中检测到语音信号,可以相对准确的定位语音段数据和非语音段数据之间的边界。
本发明提供的一种语音检测方法包括以下步骤:
步骤S10,获取原始音频,在时域上分析所述原始音频的短时能量和短时过零率,通过短时能量和短时过零率剔除原始音频中的部分非语音信号;
步骤S20,对于所述步骤S10保留下来的音频信号,在频域上分析其子带的谱包络特性和子带的熵特性,进一步剔除所述音频信号中的部分非语音信号;
步骤S30,对于保留下来的各待甄别帧的音频信号,将特征相似的连续若干帧组成一个音频段;
步骤S40,对于每个待甄别音频段,通过高斯混合模型对于该音频段中是否包含语音数据进行段级决策,最终得到语音检测结果。
从上述技术方案可以看出,本发明提供了一种高效鲁棒的语音检测方法,其具有以下有益效果:
(1)本发明提供的语音检测方法可以应用到各种语音识别系统的前端模块,通过该模块可以准确的剔除待识别音频流中的非语音数据,提高语音识别系统的效率和鲁棒性;
(2)本发明提供的语音检测方法可以应用到各种语音编码系统的前端模块,通过该模块可以准确的定位语音段数据和非语音段数据的边界,使语音编码系统只对语音段数据进行传输,提高通信效率;
(3)本发明提供的语音检测方法可以在各种平稳和非平稳随机噪声环境下快速、准确的检测到语音数据;可以有效的区分语音信号和各种非语音信号,不受说话人、环境和语种的限制。
附图说明
图1为根据本发明一实施例的语音检测方法的流程图;
图2为根据本发明一实施例的语音检测方法中时域分析部分的流程图;
图3为根据本发明一实施例的语音检测方法中频域分析部分的流程图;
图4为根据本发明一实施例的语音检测方法中音频帧聚类部分的流程图;
图5为根据本发明一实施例的语音检测方法中通过高斯混合模型进行段级决策的流程图;
图6为根据本发明一实施例的语音检测方法中高斯混合模型的离线训练过程的流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。
需要说明的是,在附图或说明书描述中,相似或相同的部分都使用相同的图号。附图中未绘示或描述的实现方式,为所属技术领域中普通技术人员所知的形式。另外,虽然本文可提供包含特定值的参数的示范,但应了解,参数无需确切等于相应的值,而是可在可接受的误差容限或设计约束内近似于相应的值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310743203.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:半导体器件及其制作方法
- 下一篇:发光装置