[发明专利]一种基于多尺度递归量化分析的语音识别方法及系统在审
申请号: | 202210481126.X | 申请日: | 2022-05-05 |
公开(公告)号: | CN114999459A | 公开(公告)日: | 2022-09-02 |
发明(设计)人: | 张晓俊;朱欣程;赵登煌;陶智 | 申请(专利权)人: | 苏州大学 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/06;G10L25/18;G10L25/24;G10L25/36 |
代理公司: | 苏州市中南伟业知识产权代理事务所(普通合伙) 32257 | 代理人: | 张荣 |
地址: | 215000 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 尺度 递归 量化 分析 语音 识别 方法 系统 | ||
1.一种基于多尺度递归量化分析的语音识别方法,其特征在于:包括以下步骤:
S1、提取语音信号的声门波信号;
S2、利用Gammatone滤波器对声门波信号多频带划分,得到若干个频率通道的声门波信号;
S3、通过时间延迟和嵌入维数重建各频率通道的声门波信号的多尺度相空间,并根据相空间中两两相点之间的距离构建递归图;
S4、根据递归图量化声门波信号在各频率通道中的非线性动态递归特性,得到各频率通道的声门波信号的若干特征参数;
S5、将语音信号分为训练集与测试集,利用训练集的特征参数训练识别模型;
S6、利用训练好的识别模型对测试集的特征参数进行预测分类。
2.如权利要求1所述的一种基于多尺度递归量化分析的语音识别方法,其特征在于:所述Gammatone滤波器的时域冲击响应为:
gi(t)=Bkt(k-1)e-2πbtcos(2πfi+φ)u(t)
其中,滤波器阶数k设置为4,滤波器初始相位Ф设置为0;fi为第i通道滤波器的中心频率;B是与等效矩形带宽有关的参数;u(t)为阶跃函数。
3.如权利要求2所述的一种基于多尺度递归量化分析的语音识别方法,其特征在于:所述中心频率为:
其中,C与品质因子和带宽有关,fl和fh是滤波器的最低和最高频率;滤波器的个数K为24;B是与等效矩形带宽ERB有关的参数:
B=1.019·ERB(fi)
等效矩形带宽ERB与滤波器中心频率关系如下:
ERB(fi)=24.7+0.108fi。
4.如权利要求1所述的一种基于多尺度递归量化分析的语音识别方法,其特征在于:设置长度为N的时间序列{x(1),x(2),...,x(N)},通过Takens嵌入定理重建相空间:
其中,τ是时间延迟,m是嵌入维数,重构相空间中由向量表示的点总数为n=N-(m-1)τ。
5.如权利要求4所述的一种基于多尺度递归量化分析的语音识别方法,其特征在于:当相空间中两两相点之间的距离小于阈值,则代表这两个点之间的距离是递归的,得到的递归值为:
Rij=θ(ε-||Xi-Xj||)
i,j=1,2…n
其中,ε为阈值,θ为赫维赛德函数,||·||表示范数。
6.如权利要求5所述的一种基于多尺度递归量化分析的语音识别方法,其特征在于:根据递归图,基于对重复点、对角线、垂直线或水平线的密度的分析,得到一系列关于递归值的特征参数。
7.如权利要求6所述的一种基于多尺度递归量化分析的语音识别方法,其特征在于:所述特征参数包括:递归率、确定性、最大对角线长度、对角线长度的熵、平均对角线长度、层状度、捕获时间、最大垂直线长度、第一递归时间、第二递归时间、递归时间熵、聚类系数和传递性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州大学,未经苏州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210481126.X/1.html,转载请声明来源钻瓜专利网。