[发明专利]一种基于小波变换的语音识别方法有效

专利信息
申请号: 201711370166.2 申请日: 2017-12-19
公开(公告)号: CN108198545B 公开(公告)日: 2021-11-02
发明(设计)人: 胡宁;程海峰;胡晓宁;王晏平;王海涛;王庚;马进伟 申请(专利权)人: 安徽建筑大学;中国移动通信集团安徽有限公司安庆分公司
主分类号: G10L15/02 分类号: G10L15/02;G10L15/06;G10L25/24
代理公司: 安徽合肥华信知识产权代理有限公司 34112 代理人: 余成俊
地址: 230601 安徽省*** 国省代码: 安徽;34
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 变换 语音 识别 方法
【权利要求书】:

1.一种基于小波变换的语音识别方法,其特征在于:具体步骤如下:

(1)声音输入设备输入语音信号;

(2)预处理模块对输入的信号进行预处理;

(3)特征提取模块提出基于小波变换的特征参数;

(4)训练模块将特征参数提取后的特征矢量参数,然后通过特征建模模块建立训练语音的参考模型库;

(5)识别模块将输入语音的特征矢量参数和参考模型库的模型进行比较,将相似度最高的模型作为识别候选结果输出;

(6)后处理模块对步骤(5)中的识别候选结果通过语音输出模块处理得到最终的识别结果;

步骤(3)中提取出基于小波变换的特征参数,具体步骤如下:

1)对输入的信号进行预处理、分帧、加汉明窗函数;

2)将每帧加窗的信号进行小波包变换,获得子频带;

3)对每个子频带取傅里叶变换,再进行频率合成;

4)用M个Mel带通滤波器对其滤波,将每个滤波器的输出取对数,得到相应频带的对数功率谱,并进行离散余弦变换,得到13维Mel频率倒谱系数。

2.根据权利要求1所述的一种基于小波变换的语音识别方法,其特征在于:步骤(3)的具体步骤如下:

输入汉语元音、辅音x(t),t为时间变量,

语音信号进行采样:对输入语音信号进行采样频率fs为8kHz的采样,采样后的信号为x(t)′,

再进行预加重1-0.98Z-1的处理,1-0.98Z-1的时域形式为预加重后的语音信号

其中,为冲激函数;

用窗长10ms,窗移8ms的汉明窗对语音信号进行加窗处理,分帧采用交叠分段的方法,前一帧和后一帧的交叠部分为帧移,用可移动的有限长度窗口进行加权的方法实现,即用窗函数w′(t)来乘预加重后的语音信号a(t),从而形成加窗语音信号b(t),

b(t)=a(t)×w′(t)

其窗函数为:

N为窗长,窗长即为帧长,加窗分帧处理后得到的第i帧信号为xi(t)=w′(t)b(t),0≤t≤N-1

特征参数提取阶段:

对预处理后的每一帧语音信号分别取2或3层小波包变换,得到4或8个子频带,再对每个子频带求64个点FFT,再对各个频带进行合成;

参数MFCC是通过傅氏变换求得,Mel频率与实际频率的具体关系用下式表示:

Mel(f)=2595*lg(1+f/700) (1)

根据Zwicker的分析,临界频率带宽随着频率的变化而变化,并与Mel频率的增长一致,在1000Hz以下,呈线性分布,带宽为100Hz左右;在1000Hz以上呈对数增长,类似于临界频带的划分,将语音频率划分成一系列三角形的滤波器序列,即Mel滤波器组,取每个三角形的滤波器频率带宽内所有信号幅度加权作为某个带通滤波器的输出,然后对所有的滤波器输出做对数运算,再进一步做离散余弦变换DCT,即得到频率倒谱系数WPMFCC;

根据式(1)将实际频率尺度转换为Mel频率尺度;

在Mel频率轴上配置L个通道的三角形滤波器组,L的个数由信号的截止频率决定,每一个三角形滤波器的中心频率c(l)在Mel频率上等间隔分配,设分别是第1个三角形滤波器的下限、中心和上限频率,则相邻三角形滤波器之间的下限、中心和上限频率有如图所示的如下关系成立:

c(l)=h(l-1)=o(l+1)

根据语音信号幅度谱Xn(k)求每一个三角形滤波器的输出:

对所有滤波器输出做对数运算,再进一步做离散余弦变换即可得到参数MFCC;

以单词作为一个识别单元,利用模板匹配方法进行识别,在训练阶段,将训练数据中每个单词提取的特征矢量时间序列作为模板存入模板库,在识别阶段,将待识别语音的特征矢量时间序列依次与模板库中的每个模板进行相似度比较,将相似度最高者作为识别结果输出。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽建筑大学;中国移动通信集团安徽有限公司安庆分公司,未经安徽建筑大学;中国移动通信集团安徽有限公司安庆分公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201711370166.2/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top