[发明专利]基于支持向量机的语音识别方法、装置、设备及存储介质在审

申请号：	201911120425.5	申请日：	2019-11-15
公开（公告）号：	CN110797011A	公开（公告）日：	2020-02-14
发明（设计）人：	褚孝鹏;李萌;赵辰;龚政;邱惠昌	申请（专利权）人：	天津光电通信技术有限公司
主分类号：	G10L15/02	分类号：	G10L15/02;G10L15/06;G10L15/26;G10L19/02;G10L25/18
代理公司：	12229 天津合正知识产权代理有限公司	代理人：	吕琦
地址：	300211***	国省代码：	天津;12
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	特征量语音数据支持向量机加权处理语音识别语音语音识别结果存储介质倒谱系数干扰信息梅尔频率时序特征外界环境真实语音贡献量发声去噪过滤
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明实施例公开了一种基于支持向量机的语音识别方法、装置、设备及存储介质，其中，所述方法包括：从语音数据中提取梅尔频率倒谱系数的特征量；对所述语音数据进行去噪处理；对所述特征量根据贡献量进行加权处理；获取所述语音数据中的语音时序特征，并与经过加权处理后的特征量进行组合；将组合后的特征量输入训练完成后的语音识别支持向量机，得到语音识别结果。不仅可以对干扰信息实现过滤，增强真实语音信号，同时考虑到发声的特征，能够在复杂的外界环境下增强对语音的识别。

技术领域

本发明涉及语音识别技术领域，尤其涉及一种基于支持向量机的语音识别方法、装置、设备及存储介质。

背景技术

语音识别技术是人机接口应用的前沿技术之一，作为语音信号处理的一个研究方向，近年来语音识别得到了迅速发展，在国际化浪潮以及多民族和多文化的相互交织的大背景下，语音识别越来越受到人们的关注。

语音识别在军事情报侦察领域具有十分重要的意义，可以侦察敌情，预警国家安全，预防突发事件的效用。

在实现本发明的过程中，发明人发现如下技术问题：由于在军事领域，其较容易受到外界环境噪声的干扰，而噪声的干扰会严重影响语音识别的效果，导致识别准确率低，无法有效识别语音类别。

发明内容

本发明实施例提供了一种基于支持向量机的语音识别方法、装置、设备及存储介质，以解决上述提及的至少一个技术问题。

第一方面，本发明实施例提供了一种基于支持向量机的语音识别方法，包括：

从语音数据中提取梅尔频率倒谱系数的特征量；

对所述语音数据进行去噪处理；

对所述特征量根据贡献量进行加权处理；

获取所述语音数据中的语音时序特征，并与经过加权处理后的特征量进行组合；

将组合后的特征量输入训练完成后的语音识别支持向量机，得到语音识别结果。

进一步的，所述从语音数据中提取梅尔频率倒谱系数的特征量，包括：

对语音数据进行预加重处理；

对预加重处理后的语音数据进行加窗分帧；

对各帧数据进行快速傅里叶变换；

对变换后的数据进行三角波滤波，并计算对数能量谱；

对对数能量谱进行余弦变换，输出梅尔频率倒谱系数的特征量。

进一步的，所述对所述语音数据进行去噪处理包括：

利用训练完成后的去噪支持向量机对语音数据进行去噪。

进一步的，所述语音时序特征包括：

幅值和过零率。

进一步的，所述对所述特征量根据贡献量进行加权处理包括：

对所述特征参数求取类间方差或类内方差，根据类间方差或类内方差确定加权值；

根据所述加权值对特征参数进行加权处理。

更进一步的，所述方法还包括：

利用非语音样本和语音样本对语音识别支持向量机进行MFCC特征训练。

第二方面，本发明实施例还提供了一种基于支持向量机的语音识别装置，包括：

提取模块，用于从语音数据中提取梅尔频率倒谱系数的特征量；

去噪模块，用于对所述语音数据进行去噪处理；

加权模块，用于对所述特征量根据贡献量进行加权处理；

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于天津光电通信技术有限公司，未经天津光电通信技术有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201911120425.5/2.html，转载请声明来源钻瓜专利网。

上一篇：基于人工智能的问答评分方法、装置、设备及存储介质
下一篇：一种信息提取方法、设备及存储介质

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于支持向量机的语音识别方法、装置、设备及存储介质在审

专利文献下载