[发明专利]一种基于小波变换的语音识别方法有效

专利信息
申请号: 201711370166.2 申请日: 2017-12-19
公开(公告)号: CN108198545B 公开(公告)日: 2021-11-02
发明(设计)人: 胡宁;程海峰;胡晓宁;王晏平;王海涛;王庚;马进伟 申请(专利权)人: 安徽建筑大学;中国移动通信集团安徽有限公司安庆分公司
主分类号: G10L15/02 分类号: G10L15/02;G10L15/06;G10L25/24
代理公司: 安徽合肥华信知识产权代理有限公司 34112 代理人: 余成俊
地址: 230601 安徽省*** 国省代码: 安徽;34
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 变换 语音 识别 方法
【说明书】:

发明公开了一种基于小波变换的语音识别方法,声音输入设备输入语音信号;预处理模块对输入的信号进行预处理;特征提取模块提出基于小波变换的特征参数;训练模块将特征参数提取后的特征矢量参数,然后通过特征建模模块建立训练语音的参考模型库;识别模块将输入语音的特征矢量参数和参考模型库的模型进行比较,将相似度最高的模型作为识别候选结果输出;后处理模块对步骤(5)中的识别候选结果通过语音输出模块处理得到最终的识别结果。本发明小波变换对不同的频率在时域上的取样步长是可调节的,它比傅氏变换具有更好的时频窗口特性,较易扑捉细节。同时,将上述参数用于单元音识别中,也取得较好的效果。

技术领域

本发明涉及语音识别技术领域,尤其涉及一种基于小波变换的语音识别方法。

背景技术

计算机技术的飞速发展,使人与机器用自然语言进行对话的梦想逐渐接近现实。语音识别就是研究让机器听懂人类语言的一门科学,也是人机交互最重要的一步。在语音识别系统中,特征参数提取是关键环节之一。语音识别中信号处理一般都采用的是傅里叶变换。傅里叶变换物理意义直观、计算简捷,广泛应用在信号的谱分析中。但是也有严重的不足。傅里叶变换表示了信号频谱的统计特性,它是信号在整个时域内的积分,信号的频谱表征了信号中频率分量的总强度,但却不能表明这些频率分量是何时产生的,没有局部分析信号的功能,不具备瞬变信息。而在对时变或非平稳语音信号(尤其辅音)的分析中,应当尽可能的知道信号在任意时刻附近的频域特征,因此将一维的时域信号映射到一个二维的时频平面来观察信号的时频特性,即构建信号的相空间,则形成信号的时频分析。小波变换对不同的频率成分在时频域上的取样步长是调节性的,它在高频时取样步长小,而在低频时取样步长大。小波变换在时频域都有局部分析能力,正是这些特性,使得小波变换在语音信号处理中有更大的优势。

(1)傅氏变换处理平稳信号较好,而对非平稳信号处理效果差,如辅音。对辅音在时频域变化快的信号,小波变换是较好的选择。Farooq等人[1]提出用小波包得到局部频率段特征,小波包将频率划分为多个子带,子带能量值作为特征参数,在塞音识别中,识别率比参数MFCC提高了10个百分点。有噪语音相对于干净语音上在时频域上叠加了干扰值,在特征参数中提取中减去一个定值,这个值相当于白噪声的频谱值,和干净语音特性接近[2];Farooq[3]又用离散小波变换划分局部频率段,低频部分得到较细的划分,在音素识别中元音识别率最好。生理学研究证明,对听觉起关键作用的耳蜗内基底膜,其作用相当于一组建立在薄膜振动基础上的恒Q的带通频率分析器。并且生理信号被分解后长表现出高频分量持续时间较短,低频分量持续时间较长的特点。这也正和小波分析的性质互相吻合。为此,张学英等人[4]提出基于Bark域小波包分解,应用在语音识别中,在噪音中识别率比参数MFCC高10个百分点。Farooq O.[5]和Ruhi Sarikaya[6]提出了基于Mel域小波包分解,分别在语音识别中和说话人识别中取得了较好的识别效果。小波包分解在小波空间和尺度空间进行分解,得到众多频段,从信号处理的观点看,用尽量少的系数,反映尽可能多的信息,这需要优化小波包分解。Jorge Silva[7]提出最低代价树裁剪算法进行小波包分解,在音素识别中取得较好的效果。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽建筑大学;中国移动通信集团安徽有限公司安庆分公司,未经安徽建筑大学;中国移动通信集团安徽有限公司安庆分公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201711370166.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top