[发明专利]一种语言类别的识别方法、装置、电子设备及存储介质有效
申请号: | 202110186793.0 | 申请日: | 2021-02-18 |
公开(公告)号: | CN112530456B | 公开(公告)日: | 2021-05-28 |
发明(设计)人: | 万同堂;王秋明 | 申请(专利权)人: | 北京远鉴信息技术有限公司 |
主分类号: | G10L25/24 | 分类号: | G10L25/24;G10L15/16 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 刘凤 |
地址: | 100000 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语言 类别 识别 方法 装置 电子设备 存储 介质 | ||
本申请提供了一种语言类别的识别方法、装置、电子设备及存储介质,其中,该识别方法包括:将待识别语音中各原始帧的梅尔倒谱特征向量输入至第一语言类别识别模型中,确定第一语言类别识别模型中的高阶特征转换层输出的待识别语音中各合成帧的中间特征向量;基于各合成帧的中间特征向量,确定待识别语音的高阶特征向量;将高阶特征向量输入至第二语言类别识别模型中,确定待识别语音所属的目标语言类别;其中,第一语言类别识别模型为神经网络模型,第二语言类别识别模型为概率线性判断分析模型。本申请能够基于包含用于区分语音的语言类别的语音特征的高阶特征向量,确定待识别语音的语言类别,提高了语言类别识别的准确度。
技术领域
本申请涉及语音信息处理技术领域,具体而言,涉及一种语言类别的识别方法、装置、电子设备及存储介质。
背景技术
现阶段,随着多媒体信息技术的快速发展,语种识别技术在多语言语音识别系统、多语言语音处理系统中的作用越来越重要,其中,语种识别技术用于识别语音所使用的语言类别,比如,英语、汉语。
相关技术中,在对语音的语言类别进行识别时,首先提取语音的梅尔倒谱系数(Mel Frequency Cepstrum Coefficient, MFCC),再基于梅尔倒谱系数确定语音的语言类别。
但是,在生成梅尔倒谱系数的过程中,需要对语音信号中的高低频信号进行衰减,这使得梅尔倒谱系数中并不能包含语音信号的所有语音特征,即梅尔倒谱系数中缺失用于区分语音的语言类别的相关语音特征,进而造成基于梅尔倒谱系数确定语音的语言类别时,准确度低。
发明内容
有鉴于此,本申请实施例的目的在于提供一种语言类别的识别方法、装置、电子设备及存储介质,能够基于包含用于区分语音的语言类别的语音特征的高阶特征向量,确定待识别语音的语言类别,提高了语言类别识别的准确度。
第一方面,本申请实施例提供了一种语言类别的识别方法,所述识别方法包括:
将待识别语音中各原始帧的梅尔倒谱特征向量输入至预先训练好的第一语言类别识别模型中,确定所述第一语言类别识别模型中的高阶特征转换层输出的所述待识别语音中各合成帧的中间特征向量;
基于所述待识别语音中各合成帧的中间特征向量,确定所述待识别语音的高阶特征向量;
将所述待识别语音的高阶特征向量输入至预先训练好的第二语言类别识别模型中,确定所述待识别语音所属的目标语言类别;其中,所述第一语言类别识别模型为神经网络模型,所述第二语言类别识别模型为概率线性判断分析模型。
在一种可能的实施方式中,所述将待识别语音中各原始帧的梅尔倒谱特征向量输入至预先训练好的第一语言类别识别模型中,确定所述第一语言类别识别模型中的高阶特征转换层输出的所述待识别语音中各合成帧的中间特征向量,包括:
针对所述待识别语音的每个原始帧,根据该原始帧的梅尔倒谱特征向量,以及与该原始帧相邻的预设数量的其他原始帧的梅尔倒谱特征向量,更新该原始帧的梅尔倒谱特征向量;
根据所述待识别语音中各原始帧的更新后的梅尔倒谱特征向量,以及预设的每个合成帧包含的原始帧的数量,确定所述高阶特征转换层输出的所述待识别语音中各合成帧的中间特征向量。
在一种可能的实施方式中,所述基于所述待识别语音中各合成帧的中间特征向量,确定所述待识别语音的高阶特征向量,包括:
基于所述待识别语音中各合成帧的中间特征向量,确定所述待识别语音的合成特征向量;
基于所述待识别语音的合成特征向量,以及预设的投影矩阵,确定所述待识别语音的高阶特征向量;其中,所述高阶特征向量的维度小于所述合成特征向量的维度;所述投影矩阵用于降低合成特征向量的维度。
在一种可能的实施方式中,通过如下方式对所述第一语言类别识别模型进行训练:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京远鉴信息技术有限公司,未经北京远鉴信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110186793.0/2.html,转载请声明来源钻瓜专利网。