[发明专利]一种基于Mel域的小波语音识别特征参数提取方法在审
申请号: | 201711439300.X | 申请日: | 2017-12-27 |
公开(公告)号: | CN108172214A | 公开(公告)日: | 2018-06-15 |
发明(设计)人: | 胡宁;胡晓宁;程海峰;宁璐;朱方敢;洪英举;王龙峰;王智超;王晏平 | 申请(专利权)人: | 安徽建筑大学 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/04;G10L15/06;G10L15/10;G10L25/18;G10L25/21 |
代理公司: | 安徽深蓝律师事务所 34133 | 代理人: | 汪锋 |
地址: | 230601 安徽省合肥市*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于Mel域的小波语音识别特征参数提取方法,首先对输入的语音信号进行预处理,然后提取反映信号特征的特征矢量参数,接着建立训练语音的参考模型库,然后通过比较得到识别候选结果输出,最后对识别候选结果通过语音知识处理得到最终的识别结果。本发明提出了参数WPCC,小波滤波器替换Mel滤波器,离散小波变换取代离散余弦变换,将该参数用于辅音和元音识别,具有较好的效果。 1 | ||
搜索关键词: | 语音识别特征 参数提取 识别候选 小波 滤波器 预处理 离散小波变换 离散余弦变换 特征矢量参数 小波滤波器 参考模型 反映信号 训练语音 语音信号 语音知识 元音识别 辅音 替换 输出 | ||
(1)、输入语音信号;
(2)、对输入的语音信号进行预处理;
(3)、预处理后,基于小波变换从语音信号中提取反映信号特征的特征矢量参数;
(4)、根据提取的特征矢量参数,建立训练语音的参考模型库;
(5)、将输入的语音信号的特征矢量参数和参考模型库的模型进行比较,选择相似度最高的模型作为识别候选结果输出;
(6)、对步骤5中的识别候选结果通过语音知识处理得到最终的识别结果。
2.根据权利要求1所述的一种基于Mel域的小波语音识别特征参数提取方法,其特征在于:步骤(3)中过程如下:(1)、对输入的语音信号进行预处理、分帧、加窗函数;
(2)、将每帧加窗的语音信号进行小波包变换,获得子频带;
(3)、提取每个子频带的能量谱;
(4)、对能量谱取离散小波变换,得到13维系数。
3.根据权利要求2所述的一种基于Mel域的小波语音识别特征参数提取方法,具体步骤如下:输入汉语元音、辅音x(t),t为时间变量,
语音信号进行采样:对输入语音信号进行采样频率fs为8kHz的采样,采样后的信号为x(t)',,再进行预加重1‑0.98Z‑1的处理,1‑0.98Z‑1的时域形式为预加重后的语音信号为其中,为冲激函数;
用窗长32ms,窗移16ms的汉明窗对语音信号进行加窗处理,分帧采用交叠分段的方法,前一帧和后一帧的交叠部分为帧移,用可移动的有限长度窗口进行加权的方法实现,即用窗函数w'(t)来乘预加重后的语音信号a(t),从而形成加窗语音信号b(t),b(t)=a(t)×w'(t)
其窗函数为:
N为窗长,窗长即为帧长,加窗分帧处理后得到的第i帧信号为
xi(t)=w'(t)b(t),0≤t≤N‑1
特征参数提取阶段:
对预处理后的每一帧语音信号进行图3的24个频段小波包分解,每个频带中心频率和带宽见表1,对每个频带取能量谱,再对参数取3层离散小波变换即得到参数WPCC;
以单词作为一个识别单元,利用模板匹配方法进行识别,在训练阶段,将训练数据中每个单词提取的特征矢量时间序列作为模板存入模板库,在识别阶段,将待识别语音的特征矢量时间序列依次与模板库中的每个模板进行相似度比较,将相似度最高者作为识别结果输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽建筑大学,未经安徽建筑大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711439300.X/,转载请声明来源钻瓜专利网。