[发明专利]基于支持向量机的语音识别方法、装置、设备及存储介质在审
申请号: | 201911120425.5 | 申请日: | 2019-11-15 |
公开(公告)号: | CN110797011A | 公开(公告)日: | 2020-02-14 |
发明(设计)人: | 褚孝鹏;李萌;赵辰;龚政;邱惠昌 | 申请(专利权)人: | 天津光电通信技术有限公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/06;G10L15/26;G10L19/02;G10L25/18 |
代理公司: | 12229 天津合正知识产权代理有限公司 | 代理人: | 吕琦 |
地址: | 300211*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 特征量 语音数据 支持向量机 加权处理 语音识别 语音 语音识别结果 存储介质 倒谱系数 干扰信息 梅尔频率 时序特征 外界环境 真实语音 贡献量 发声 去噪 过滤 | ||
1.一种基于支持向量机的语音识别方法,其特征在于,包括:
从语音数据中提取梅尔频率倒谱系数的特征量;
对所述语音数据进行去噪处理;
对所述特征量根据贡献量进行加权处理;
获取所述语音数据中的语音时序特征,并与经过加权处理后的特征量进行组合;
将组合后的特征量输入训练完成后的语音识别支持向量机,得到语音识别结果。
2.根据权利要求1所述的方法,其特征在于,所述从语音数据中提取梅尔频率倒谱系数的特征量,包括:
对语音数据进行预加重处理;
对预加重处理后的语音数据进行加窗分帧;
对各帧数据进行快速傅里叶变换;
对变换后的数据进行三角波滤波,并计算对数能量谱;
对对数能量谱进行余弦变换,输出梅尔频率倒谱系数的特征量。
3.根据权利要求2所述的方法,其特征在于,所述对所述语音数据进行去噪处理包括:
利用训练完成后的去噪支持向量机对语音数据进行去噪。
4.根据权利要求3所述的方法,其特征在于,所述语音时序特征包括:
幅值和过零率。
5.根据权利要求4所述的方法,其特征在于,所述对所述特征量根据贡献量进行加权处理包括:
对所述特征参数求取类间方差或类内方差,根据类间方差或类内方差确定加权值;
根据所述加权值对特征参数进行加权处理。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
利用非语音样本和语音样本对语音识别支持向量机进行MFCC特征训练。
7.一种基于支持向量机的语音识别方法装置,其特征在于,包括:
提取模块,用于从语音数据中提取梅尔频率倒谱系数的特征量;
去噪模块,用于对所述语音数据进行去噪处理;
加权模块,用于对所述特征量根据贡献量进行加权处理;
组合模块,用于获取所述语音数据中的语音时序特征,并与经过加权处理后的特征量进行组合;
识别模块,用于将组合后的特征量输入训练完成后的语音识别支持向量机,得到语音识别结果。
8.根据权利要求7所述的装置,其特征在于,所述加权模块,用于
对所述特征参数求取类间方差或类内方差,根据类间方差或类内方差确定加权值;
根据所述加权值对特征参数进行加权处理。
9.一种设备,其特征在于,所述设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-6中任一所述的基于支持向量机的语音识别方法。
10.一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-6一所述的基于支持向量机的语音识别方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津光电通信技术有限公司,未经天津光电通信技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911120425.5/1.html,转载请声明来源钻瓜专利网。