[发明专利]一种基于数据选择性和高斯混合模型的语音活动检测方法有效
申请号: | 202010708487.4 | 申请日: | 2020-07-22 |
公开(公告)号: | CN111739562B | 公开(公告)日: | 2022-12-23 |
发明(设计)人: | 王涛;阮振裔;李平 | 申请(专利权)人: | 上海大学 |
主分类号: | G10L25/87 | 分类号: | G10L25/87;G10L25/84;G10L25/18;G10L25/27 |
代理公司: | 上海上大专利事务所(普通合伙) 31205 | 代理人: | 何文欣 |
地址: | 200444*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 数据 选择性 混合 模型 语音 活动 检测 方法 | ||
本发明提出了一种基于数据选择性和高斯混合模型的语音活动检测方法,步骤如下:对输入的含噪语音信号进行分帧、加窗处理后,通过FFT将信号转换到频域上;根据频域上的信号计算平滑信号功率谱,进而通过平滑信号功率谱计算平滑子带对数能量,平滑子带对数能量作为语音特征用于GMM建模;选取前M帧信号进行GMM参数集初始化;对每帧信号进行GMM参数集数据选择性更新;根据参数集计算子带语音存在概率;将一帧信号中所有子带的语音存在概率相加与判决阈值进行比较,若大于判决阈值,则判定当前帧为语音帧,否则为噪声帧,输出每一帧的VAD结果。本发明方法在基于GMM的VAD算法中引入了数据选择性,在保证正确率基本不变情况下,能够大幅降低计算复杂度。
技术领域
本发明涉及语音信号处理技术领域,特别涉及一种基于数据选择性和GMM(Gaussian Mixture Model:高斯混合模型)的VAD(Voice Activity Detection:语音活动检测)方法。
背景技术
语音信号处理是目前一个非常热门的领域。VAD作为语音信号处理中的一个方向,其目的是从含噪语音信号中区分出语音段和非语音段。VAD在许多领域都发挥着重要的作用:在存储或传输语音的场景下,其可以从连续的语音流中分离出有效语音,能够有效降低存储或传输的数据量;在语音增强领域,其可以在非语音段估计噪声信息,从而进行噪声抑制。
早期的VAD算法大多基于如能量,短时过零率,倒谱距离,谱熵等语音特征直接对声音信号作出语音/非语音判决。这些算法的原理比较简单,计算复杂度低,在无噪声或者高信噪比情况下具有较高的正确率。但是一旦信噪比下降,其正确率就会急剧降低。进入21世纪以来,基于统计学模型的VAD算法因为更好的性能获得了快速的发展。其中有研究人员使用GMM对含噪语音进行建模,并设计了VAD算法。在GMM建模过程中,关键步骤是计算其参数集(均值,方差,权重)。首先需要选取一定的样本数据初始化参数集。之后对新的数据,需要持续地进行参数集的更新。基于GMM的VAD算法虽然在低信噪比环境下具有更好的鲁棒性,但是计算复杂度也大大增加。
发明内容
本发明要解决的技术问题是在保证正确率基本不变的情况下,如何降低基于GMM的VAD方法的计算复杂度。本发明提供一种基于数据选择性和高斯混合模型的语音活动检测方法,能保证正确率基本不变情况下,大幅降低计算复杂性。
为了上述发明目的,本发明创造采用如下发明构思:
为解决上述问题,本发明提供的技术方案是对基于GMM的VAD方法中GMM参数集更新过程做出改进。该技术方案的设计构思是在参数集更新过程中引入数据选择性思想,当数据对方法的正确率提升有限甚至有损的情况下,保持参数不变,从而在保持正确率大体不变的同时,大幅降低计算复杂度。
根据上述发明构思,本发明采用如下技术方案:
一种基于数据选择性和高斯混合模型GMM的语音活动检测VAD方法,操作步骤如下:
步骤一:对输入的含噪语音信号进行采样、分帧、加窗处理后,通过FFT(FastFourier Transformation,快速傅里叶变换)将信号转换到频域上;
步骤二:计算平滑子带对数能量;
步骤三:选取前M帧信号进行GMM参数集初始化;
步骤四:进行GMM参数集数据选择性更新;
步骤五:根据参数集计算子带语音存在概率,子带语音存在概率通过一个数值反映了当前子带的属性;
步骤六:给出帧单位上VAD结果。
优选地,所述步骤二中平滑子带对数能量的计算方法为:
通过频域上信号的幅度谱计算功率谱,并在帧间进行平滑,从而得到平滑信号功率谱。进而将一帧信号分为多个子带计算平滑子带对数能量,作为语音特征用于GMM建模。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海大学,未经上海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010708487.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:涤纶纤维高日晒染色工艺
- 下一篇:一种湿式砂光机
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置