[发明专利]语音识别方法、装置以及计算机设备在审
申请号: | 201910871726.5 | 申请日: | 2019-09-16 |
公开(公告)号: | CN110556126A | 公开(公告)日: | 2019-12-10 |
发明(设计)人: | 王健宗 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G10L25/24 | 分类号: | G10L25/24;G10L25/45;G10L17/04 |
代理公司: | 11015 北京英特普罗知识产权代理有限公司 | 代理人: | 王勇 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音片 语音识别 加窗 计算机可读存储介质 计算机设备 特征向量 语音片段 语音数据 语音帧 预设 语音识别装置 加窗算法 梅尔频率 阈值时 分帧 声纹 向量 鉴别 | ||
本发明公开了一种语音识别方法,该方法包括:获取语音片段,对所述语音片段进行分帧,得到每一帧语音数据;根据预设的平稳加窗算法依次对所述语音片段的每一帧语音数据进行加窗,得到所述语音片段的加窗语音帧;提取所述语音片段的加窗语音帧的梅尔频率倒谱特征向量MFCC;计算所述MFCC与声纹鉴别向量的距离;当所述距离小于预设阈值时,判断所述语音片段的识别结果为通过。本发明还提供一种语音识别装置、计算机设备以及计算机可读存储介质。本发明提供的语音识别方法、装置、计算机设备及计算机可读存储介质能够更加精确地计算出语音片段中的特征向量,从而提升语音识别的精度。
技术领域
本发明涉及语音识别技术领域,尤其涉及一种语音识别方法、装置、计算机设备及计算机可读存储介质。
背景技术
语音识别属于生物特征识别技术的一种,是一项根据语音波形中反映语音中生理或行为的特征的语音参数,自动识别出语音对应的用户身份的技术。现有技术中,语音识别一般都是利用语音信号中的声纹特征进行识别,其中,在声纹特征提取阶段,现有的加窗处理过程,比如使用汉宁窗、汉明窗、三角窗、高斯窗等对语音数据进行加窗,几乎都会对原始语音信号进行了修改,从而造成了部分声纹特征信息的丢失,降低了语音识别的准确率。
发明内容
有鉴于此,本发明提出一种语音识别方法、装置、计算机设备及计算机可读存储介质,能够获取语音片段之后进行分帧得到每一帧语音数据,然后根据预设的平稳加窗算法对所每一帧语音数据进行加窗以得到加窗语音帧;接着,再提取所述语音片段的加窗语音帧的梅尔频率倒谱特征向量MFCC,并计算所述MFCC与声纹鉴别向量的距离;当所述距离小于预设阈值时,判断所述语音片段的识别结果为通过。通过以上方式,在对语音信号进行少量修改的情况下能够更加精确地计算出语音片段中的特征向量,从而提升语音识别的精度。
首先,为实现上述目的,本发明提供一种语音识别方法,所述方法包括:
获取语音片段,对所述语音片段进行分帧,得到每一帧语音数据;根据预设的平稳加窗算法依次对所述语音片段的每一帧语音数据进行加窗,得到所述语音片段的加窗语音帧;提取所述语音片段的加窗语音帧的梅尔频率倒谱特征向量MFCC;计算所述MFCC与声纹鉴别向量的距离,其中,所述声纹鉴别向量是预先将所述用户的采样语音信息输入到声纹特征训练模型进行训练得到;当所述距离小于预设阈值时,判断所述语音片段的识别结果为通过。
可选地,所述平稳加窗算法为:其中,T1为加窗语音帧的时长,w(t)表示在语音帧的时长范围内的t时刻的需对t时刻语音信号进行加窗的加权值,K和K′是常数变量,K<K′且K+K′=1,K是根据环境噪声进行设置的。
可选地,所述方法还包括步骤:对每一帧语音数据进行加窗时,获取语音数据中的环境噪声的频率分布信息,再根据噪声的最高频率分布调整所述K。
可选地,声纹特征训练模型为高斯混合模型GMM,所述方法还包括步骤:通过将GMM训练出不同用户的声纹鉴别向量与将所述MFCC分别进行距离计算;选择出小于预设阈值且最小的距离所对应的第一声纹鉴别向量;将所述第一声纹鉴别向量对应的第一用户作为所述语音片段对应的目标用户。
可选地,所述距离为余弦距离,所述距离对应的计算公式为:
其中,x代表标准声纹鉴别向量,y代表当前声纹鉴别向量。
可选地,在所述对所述语音片段进行分帧之前,所述方法还包括:对所述语音片段进行预加重处理,补偿语音片段中的高频成分。
此外,为实现上述目的,本发明还提供一种语音识别装置,所述装置包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910871726.5/2.html,转载请声明来源钻瓜专利网。