[发明专利]一种基于改进的并行模型组合的声音事件识别方法有效

专利信息
申请号: 201310239724.7 申请日: 2013-06-17
公开(公告)号: CN103310789A 公开(公告)日: 2013-09-18
发明(设计)人: 刘宏;王一;李晓飞 申请(专利权)人: 北京大学深圳研究生院
主分类号: G10L15/06 分类号: G10L15/06;G10L15/02
代理公司: 北京君尚知识产权代理事务所(普通合伙) 11200 代理人: 余长江
地址: 518055 广东省深*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 改进 并行 模型 组合 声音 事件 识别 方法
【说明书】:

技术领域

发明属于智能监控中音频信号处理领域,涉及室内环境中声音事件识别方法,具体涉及一种基于改进的并行模型组合的声音事件识别方法。

背景技术

相对于人工智能领域中成熟的语音识别方法来讲,利用计算机来进行声音事件的识别是近几年在比较新研究方向。声音事件识别针对的是自然环境中发声的具有一定含义的或是可以反映人们行为的声音事件,进行自动的判断和归类。在家庭智能监控系统中,声音事件的识别可以帮助人们远程的监控家庭室内环境中发生的情况,并及时告知用户产生了什么样的事件,有利于用户及时进行处理。但是,真实的环境中是存在着复杂的噪声的,要想实现在真实环境下的有效的监控,对噪声的处理是必须的和紧迫的。

首先,声音事件的识别属于一个模式识别的问题,类似于自动语音识别。基本的方法是信号处理和模式识别。现有的声音事件识别方法包括以下几个步骤:

(1)声音事件信号的录入,预滤波、模数变换。先把录入的模拟声音信号进行预滤波,高通滤波抑制50HZ电源噪声信号;低通滤波滤除声音信号中频率分量超过采样频率一半的部分,防止混叠干扰。对模拟声音信号进行采样和量化得到数字信号。

(2)分帧、加窗。声音信号和语音信号一样,都具有整体非平稳,局部平稳的短时平稳性,类似语音信号,可以认为声音信号在10~30ms内是平稳的,可以把声音信号按照30ms的长度进行分帧。分帧时利用窗函数进行信号的提取,窗函数它的选择(形状和长度)对短时分析参数的特性影响很大,常用的窗函数包括矩形窗、汉宁窗和汉明窗等。一般选用汉明窗,可以很好地反应语音信号的特性变化。

(3)特征提取。不同的声音事件的特征是不相同的,要想区分不同的声音信号,就要对声音信号的特征进行数学描述。常用的声音事件识别的特征有时域特征:短时能量,短时过零率。频域特征:子带能量,小波时频特性。倒谱域特征:线性预测倒谱系数(LPCC),梅尔频率倒谱系数(MFCC)等。

(4)识别。声音事件的识别方法也是采用类似于语音识别的算法。常用的声音事件识别的方法有基于支持向量机(SVM)的分类,基于混合高斯模型(GMM)聚类方法,隐马尔可夫模型(HMM)方法,贝叶斯分类算法。

其次,对噪声的处理。上述所讲述的识别方法在实际环境中应用时,识别系统的性能会随着训练数据和测试数据的失配急剧恶化,而导致所述失配的原因就是环境噪声的影响。由噪声引起的训练和测试的不匹配可以从信号空间、特征空间和模型空间三个空间来分析。常用的方法有类似于语音增强的声音增强法、鲁棒特征提取、特征补偿、模型补偿如并行模型组合(PMC)等方法对噪声进行处理,提高系统的鲁棒性。

现有的方法大部分还是沿用语音识别的一套,对噪声的处理也不外乎以上几种方法,以上方法中基于PMC的方法能够充分描述环境噪声而被广泛采用,他们可以充分挖掘环境中的信息,提高系统识别的鲁棒性,但现有的PMC方法中对于噪声特征是用单高斯模型(SGM)来描述的,对于噪声比较复杂的情况,SGM并不能很好表征噪声的特性。所以,噪声复杂的情况下识别率不够理想。

发明内容

为了解决上述技术问题,本发明的目的在于提供一种通过改进的模型参数融合的方法得到符合噪声环境的带噪声音事件模型,对于实际噪声环境下的待识别声音事件进行识别。

为了实现上述的目的,本发明技术方案为:一种基于改进的并行模型组合的声音事件识别方法,其步骤包括:

1)根据干净声音事件训练得到GMM高斯混合模型,建立干净声音事件模板;

2)根据噪声数据训练得到GMM高斯混合模型,建立噪声模板;

3)对所述噪声模板和所述干净声音事件模板采用并行模型融合的方法,得到带噪声音事件模板;

4)采样得到带噪声音事件样本信号,根据所述带噪声音事件模板中的参数对样本信号进行声音识别。

更进一步,建立干净声音事件的模板的方法如下:

1)在无噪安静室内的环境下录制声音事件的数据,对录制的声音事件进行预滤波、模数变换后再进行分帧、加窗处理;

2)提取MFCC梅尔倒谱系数特征,训练出声音事件的GMM高斯混合模板。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学深圳研究生院,未经北京大学深圳研究生院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201310239724.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top