[发明专利]基于支持向量机的语音识别方法、装置、设备及存储介质在审
申请号: | 201911120425.5 | 申请日: | 2019-11-15 |
公开(公告)号: | CN110797011A | 公开(公告)日: | 2020-02-14 |
发明(设计)人: | 褚孝鹏;李萌;赵辰;龚政;邱惠昌 | 申请(专利权)人: | 天津光电通信技术有限公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/06;G10L15/26;G10L19/02;G10L25/18 |
代理公司: | 12229 天津合正知识产权代理有限公司 | 代理人: | 吕琦 |
地址: | 300211*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 特征量 语音数据 支持向量机 加权处理 语音识别 语音 语音识别结果 存储介质 倒谱系数 干扰信息 梅尔频率 时序特征 外界环境 真实语音 贡献量 发声 去噪 过滤 | ||
本发明实施例公开了一种基于支持向量机的语音识别方法、装置、设备及存储介质,其中,所述方法包括:从语音数据中提取梅尔频率倒谱系数的特征量;对所述语音数据进行去噪处理;对所述特征量根据贡献量进行加权处理;获取所述语音数据中的语音时序特征,并与经过加权处理后的特征量进行组合;将组合后的特征量输入训练完成后的语音识别支持向量机,得到语音识别结果。不仅可以对干扰信息实现过滤,增强真实语音信号,同时考虑到发声的特征,能够在复杂的外界环境下增强对语音的识别。
技术领域
本发明涉及语音识别技术领域,尤其涉及一种基于支持向量机的语音识别方法、装置、设备及存储介质。
背景技术
语音识别技术是人机接口应用的前沿技术之一,作为语音信号处理的一个研究方向,近年来语音识别得到了迅速发展,在国际化浪潮以及多民族和多文化的相互交织的大背景下,语音识别越来越受到人们的关注。
语音识别在军事情报侦察领域具有十分重要的意义,可以侦察敌情,预警国家安全,预防突发事件的效用。
在实现本发明的过程中,发明人发现如下技术问题:由于在军事领域,其较容易受到外界环境噪声的干扰,而噪声的干扰会严重影响语音识别的效果,导致识别准确率低,无法有效识别语音类别。
发明内容
本发明实施例提供了一种基于支持向量机的语音识别方法、装置、设备及存储介质,以解决上述提及的至少一个技术问题。
第一方面,本发明实施例提供了一种基于支持向量机的语音识别方法,包括:
从语音数据中提取梅尔频率倒谱系数的特征量;
对所述语音数据进行去噪处理;
对所述特征量根据贡献量进行加权处理;
获取所述语音数据中的语音时序特征,并与经过加权处理后的特征量进行组合;
将组合后的特征量输入训练完成后的语音识别支持向量机,得到语音识别结果。
进一步的,所述从语音数据中提取梅尔频率倒谱系数的特征量,包括:
对语音数据进行预加重处理;
对预加重处理后的语音数据进行加窗分帧;
对各帧数据进行快速傅里叶变换;
对变换后的数据进行三角波滤波,并计算对数能量谱;
对对数能量谱进行余弦变换,输出梅尔频率倒谱系数的特征量。
进一步的,所述对所述语音数据进行去噪处理包括:
利用训练完成后的去噪支持向量机对语音数据进行去噪。
进一步的,所述语音时序特征包括:
幅值和过零率。
进一步的,所述对所述特征量根据贡献量进行加权处理包括:
对所述特征参数求取类间方差或类内方差,根据类间方差或类内方差确定加权值;
根据所述加权值对特征参数进行加权处理。
更进一步的,所述方法还包括:
利用非语音样本和语音样本对语音识别支持向量机进行MFCC特征训练。
第二方面,本发明实施例还提供了一种基于支持向量机的语音识别装置,包括:
提取模块,用于从语音数据中提取梅尔频率倒谱系数的特征量;
去噪模块,用于对所述语音数据进行去噪处理;
加权模块,用于对所述特征量根据贡献量进行加权处理;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津光电通信技术有限公司,未经天津光电通信技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911120425.5/2.html,转载请声明来源钻瓜专利网。