[发明专利]语音数据的识别方法、装置、芯片及可读存储介质在审
申请号: | 202011528610.0 | 申请日: | 2020-12-22 |
公开(公告)号: | CN113077787A | 公开(公告)日: | 2021-07-06 |
发明(设计)人: | 高宇;徐会 | 申请(专利权)人: | 珠海市杰理科技股份有限公司 |
主分类号: | G10L15/20 | 分类号: | G10L15/20;G10L25/24 |
代理公司: | 深圳市君之泉知识产权代理有限公司 44366 | 代理人: | 吕战竹 |
地址: | 519085 广东省珠海市吉*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 数据 识别 方法 装置 芯片 可读 存储 介质 | ||
本发明提供一种语音数据的识别方法、装置、芯片及可读存储介质,其中,该方法包括步骤:当获取到待识别语音数据后,对待识别语音数据进行分帧处理,并将分帧所得的各帧语音数据设定为目标帧语音数据;确定目标帧语音数据对应的特征向量值,并计算目标帧语音数据对应的目标能量值;基于预设的能量值与滤波系数之间的对应关系,以及目标能量值确定滤波系数;确定目标帧语音数据的目标倒谱均值,并根据特征向量值、滤波系数和目标倒谱均值确定自适应倒谱均值;将特征向量值减去自适应倒谱均值,得到目标帧语音数据的新特征向量值,并将新特征向量值输入预设的语音识别算法中,以识别目标帧语音数据。本发明提高了语音数据识别的鲁棒性和准确性。
技术领域
本发明涉及音频处理技术领域,具体涉及一种语音数据的识别方法、装置、芯片及可读存储介质。
背景技术
随着AI(Artificial Intelligence,人工智能)的快速发展,在进行人机交互时,语音识别及声纹识别技术越来越广泛的应用到我们的生活当中,利用语音识别算法,使得智能语音识别系统(音箱、耳机等)能够更好地与用户互动。但是,现实环境复杂多样,环境噪声比较大,难以提取到纯净的语音信号。当语音识别平台受限,没有太多的计算资源和存储空间时,可以通过常规的降噪训练模型或降噪算法剔除噪声部分,得到纯净的语音信号,提高语音交互的质量。在现有的语音系统中,在采集到语音数据时,可通过梅尔滤波系数得到倒谱均值,将倒谱均值作为对应的音频特征向量用于后续的处理,音频特征向量作为输入语音识别算法的核心参数,决定语音识别的正确率。
目前,最简单的降噪方式就是倒谱均值的方式,通过倒谱值减去对应的固定均值,可以一定程度上起到抗干扰的目的,提高噪声环境下的语音质量。另外语音信号失真,也就是在训练时的语音数据和实际测试的语音数据不匹配,存在误差,从而的影响语音数据的识别效果,通过倒谱均值的方式,可以有效处理这种差异性。倒谱均值一般是在实时使用时通过固定的滤波器窗长在线计算得到的,即倒谱均值是固定的,固定的倒谱均值很难快速的去除不同噪声环境所产生的噪声,即噪声鲁棒性不强,这也在一定程度上影响语音识别的精度,导致较高的语音识别出错率。
由此可知,目前的语音数据识别的鲁棒性和准确率低下。
发明内容
基于上述现状,本发明的主要目的在于提供一种语音数据的识别方法、装置、芯片及可读存储介质,以提高语音识别的鲁棒性和准确率。
为实现上述目的,本发明采用的技术方案如下:
一种语音数据的识别方法,所述语音数据的识别方法包括以下步骤:
S100,当获取到待识别语音数据后,对所述待识别语音数据进行分帧处理,得到所述待识别语音数据对应的各帧语音数据,将各帧语音数据设定为目标帧语音数据;
S200,确定所述目标帧语音数据对应的特征向量值,并计算所述目标帧语音数据对应的目标能量值;
S300,基于预设的能量值与滤波系数之间的对应关系,根据所述目标能量值确定所述目标帧语音数据的滤波系数;
S400,确定所述目标帧语音数据对应的目标倒谱均值,并根据所述特征向量值、所述滤波系数和所述目标倒谱均值确定所述目标帧语音数据的自适应倒谱均值;
S500,将所述特征向量值减去所述自适应倒谱均值,得到所述目标帧语音数据的新特征向量值,并将所述新特征向量值输入预设的语音识别算法中,以识别所述目标帧语音数据。
优选地,在所述步骤S400中,所述根据所述特征向量值、所述滤波系数和所述目标倒谱均值确定所述目标帧语音数据的自适应倒谱均值的步骤包括:
将所述特征向量值乘以所述滤波系数,得到第一乘积,并计算一和所述滤波系数之间的第一差值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于珠海市杰理科技股份有限公司,未经珠海市杰理科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011528610.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:具有基于速度的闩锁控件的车舱
- 下一篇:涂层和包括所述涂层的涂覆的切削工具
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置