[发明专利]基于多频带信号重构的生态声音识别方法有效

申请号：	201310472342.9	申请日：	2013-10-11
公开（公告）号：	CN103474066A	公开（公告）日：	2013-12-25
发明（设计）人：	李应;欧阳桢	申请（专利权）人：	福州大学
主分类号：	G10L15/20	分类号：	G10L15/20;G10L15/08;G10L15/02
代理公司：	福州元创专利商标代理有限公司 35100	代理人：	蔡学俊
地址：	350108 福建省福州市***	国省代码：	福建;35
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于频带信号生态声音识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于多频带信号重构的生态声音识别方法，其特征在于，包括以下步骤：

S01：分别对纯净声音和测试带噪声音进行OMP稀疏分解，对应输出纯净声音和测试带噪声音的重构信号和OMP特征；

S02：对纯净声音提取包括OMP特征在内的复合特征并进行DBN模型训练；

S03：提取测试带噪声音进行OMP稀疏分解后的残余信号的功率谱并进行多频带补偿；

S04：提取测试带噪声音进行OMP稀疏分解后的重构信号的功率谱，并结合所述步骤S03中进行多频带补偿后的残余信号的功率谱进行二次重构；

S05：对所述步骤S04中二次重构后的信号进行提取包括OMP特征在内的复合特征；

S06：对所述步骤S02中进行DBN模型训练后提取的复合特征和所述步骤S05中提取的包括OMP特征在内的符合特征进行DBN模型分类，输出测试带噪声音所属的生态声音类别。

2.根据权利要求1所述的基于多频带信号重构的生态声音识别方法，其特征在于，假设待分解带噪声音信号f，长度为N，进行稀疏分解之前，首先构造过完备原子字典D=(g_γ)_γ∈Γ，时频原子g_γ是Gabor原子，由参数组γ=(s,u,v,w)定义，平移因子u定义一个原子g_γ的中心位置，伸缩因子s，频率因子v和相位因子w定义其波形，其离散化时频参数γ=(s,u,v,w)=(a^j,pa^jΔu,ka^-jΔv,iΔw)，其中，0<j≤log₂N，0≤p≤N2^-j+1，0≤k<2^j+1，0≤i≤12，a=2，Δu=1/2，Δv=π，Δw=π/6；所述步骤S01具体步骤包括：

S011：初始化信号残差R₀y'=f，迭代次数k=1，最大迭代次数L；

S012：从过完备原子字典D中选出第k次迭代与信号残差最为相关的原子g_γk，|<Rky′,gγk>|≥αsupγ∈Γ|<Rky′,gγ>|,0<α≤1;]]>