[发明专利]一种动态多频带非线性语音特征提取方法在审
申请号: | 202011198847.7 | 申请日: | 2020-10-31 |
公开(公告)号: | CN112562642A | 公开(公告)日: | 2021-03-26 |
发明(设计)人: | 张晓俊;伍远博;周长伟;朱欣程;陶智;赵鹤鸣 | 申请(专利权)人: | 苏州大学 |
主分类号: | G10L15/02 | 分类号: | G10L15/02 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 朱小兵 |
地址: | 215006 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 动态 频带 非线性 语音 特征 提取 方法 | ||
1.一种动态多频带非线性语音特征提取方法,其特征在于,
将语音样本采用基于人耳听觉特性的巴克滤波器组进行滤波分频,分频后的24个频带信号自适应获得分频因子α;然后进行如下步骤处理:
(1)第0至α的频带中,将嗓音信号的语音对数运算后采用离散余弦变换提取巴克频率倒谱系数特征,求取每阶参数的均值,进行排列;
(2)在第α+1至24的频带中,将信号嵌入相空间后提取最大李雅普诺夫指数和关联维特征,求取每阶参数的均值,进行排列;
(3)将巴克频率倒谱系数特征、最大李雅普诺夫指数和关联维特征整合成动态多频带非线性特征参数。
2.根据权利要求1所述的一种动态多频带非线性语音特征提取方法,其特征在于,在步骤(1)中,提取巴克频率倒谱系数特征参数,具体包括以下步骤:
步骤1)、将巴克域子波母函数表示为:
得到听觉感知域下的函数表达式:
其中,Δb=(b2-b1)/(K-1)为的平移步长,k为尺度参数,[b1,b2]为听觉感知频率带宽,b代表听觉感知频率;
步骤2)、引入线性频率与听觉感知频率之间的函数关系:
b=6.7asinh[(f-20)/600];式中asinh表示反双曲正弦函数;
步骤3)、将步骤2)的函数关系代入步骤1)的听觉感知域下的函数表达式,得到线性频率下的听觉感知子波函数的表达式:
步骤4)、将语音能量计算出以后,通过巴克滤波器组BWm(k),通过能量对数的离散余弦变换提取出巴克频率倒谱参数,1≤m≤24。
3.根据权利要求1所述的一种动态多频带非线性语音特征提取方法,其特征在于,在步骤(2)中,最大李雅普诺夫参数的提取采用沃尔夫算法,具体包括以下步骤:
步骤1)、对离散时间序列x1,x2,x3,…,xN,采用G-P算法确定重构维数m,采用平均互信息法确定延迟时间间隔τ,重构相空间x(t)=(xt,xt-τ,…,xt-(m-1)τ),相点数为n=N-(m-1)τ;式中参数N表示离散时间序列总点数;
步骤2)、在(N-(m-1)τ)相点中,以初始相点x0为基点并选取一个与x0最近的点x1作为端点,构成初始向量,记基点端点间欧氏距离为L(t0);
步骤3)、设时间步长或演化时间t,将初始向量沿轨迹演化获得一新向量,其相应点与端点间欧氏距离记为L(t1),在相应时段内系统线性指标指数增长率记为:
步骤4)、不断迭代遍历直至所有相点后,将各指数增长率的均值作为LLE的估计值:
4.根据权利要求1所述的一种动态多频带非线性语音特征提取方法,其特征在于,在步骤(2)中,关联维特征参数的提取,包括以下步骤:
步骤1)、重构相空间:针对一组给定的一维时间序列:x1,x2,x3,…,xN,选择适当的嵌入维数m0与时间延迟量τ,构造出一个m维的相空间:
步骤2)、计算关联积分函数:
式中:表示欧式空间内状态矢量xi与xj之间的距离,θ(u)是阶跃函数,定义为:
C(r)代表相空间吸引子上距离小于r的点对数与所有点对数的比值,用于反映相点的聚散程度;
步骤3)、估计关联维数D:当时间序列N→∞,而相关距离长度r较小时,即r→0时,若关联积分函数C(r)服从于指数规律:此时吸引子具有分形特征,关联维数D与关联函数C(r)近似满足对数线性关系:D(m)=ln C(r)/lnr,通过拟合可计算出m0对应的估计值;
步骤4)、估计嵌入维数:不断增加嵌入维数m0,代入步骤2)、步骤3),反复计算直到m0逐渐收敛为一个饱和值,此时D(m)不随m0的增大而改变,该值为系统的关联维数,对应的m0为最终确定的嵌入维数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州大学,未经苏州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011198847.7/1.html,转载请声明来源钻瓜专利网。