[发明专利]语种识别方法、相关设备及可读存储介质在审

申请号：	202010607693.6	申请日：	2020-06-29
公开（公告）号：	CN111724766A	公开（公告）日：	2020-09-29
发明（设计）人：	杨军;方磊;方四安;唐磊	申请（专利权）人：	合肥讯飞数码科技有限公司
主分类号：	G10L15/00	分类号：	G10L15/00;G10L15/08;G10L15/32
代理公司：	北京集佳知识产权代理有限公司 11227	代理人：	王娇娇
地址：	230088 安徽省合肥市高新区***	国省代码：	安徽;34
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语种识别方法相关设备可读存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请公开了一种语种识别方法、相关设备及可读存储介质，在获取待识别的语音数据之后，确定该语音数据的语种特征；利用预先建立的第一语种识别模型对该语音数据的语种特征进行第一次识别，得到第一次语种识别结果；当第一次语种识别结果不准确时，利用预先建立的第二语种识别模型对该语音数据的语种特征进行第二次识别，得到第二次语种识别结果，并基于第一次语种识别结果和第二次语种识别结果，确定该语音数据的语种。上述方案中，如果第一次语种识别结果不准确，可以利用比第一语种识别模型的网络层数多的第二语种识别模型进行第二次识别，从而提升识别准确率。

技术领域

本申请涉及自然语言处理技术领域，更具体的说，是涉及一种语种识别方法、相关设备及可读存储介质。

背景技术

语种识别是计算机分析处理一个语音数据判别其所属语言种类的过程，是语音识别的一个重要研究方向。随着全球化进程的不断加快，语种识别在多语种信息服务、机器翻译及军事安全等领域都有广泛的应用前景。现有技术中，多采用诸如混合高斯模型(英文全称：Gaussian Mixture Model，英文简称：GMM)、支持向量机(英文全称：Support VectorMachine，英文简称：SVM)、高斯混合模型超矢量-支持向量机(英文全称：Gaussian SuperVector-Support Vector Machine，英文简称：GSV-SVM)的语种识别方法对语音进行语种识别。

但是，现有技术中，对语音数据进行语种识别的方法，得到的语种识别结果准确率并不理想。

因此，对现有技术中的语种识别方法进行优化显得尤为必要。

发明内容

鉴于上述问题，本申请提出了一种语种识别方法、相关设备及可读存储介质。具体方案如下：

一种语种识别方法，包括：

获取待识别的语音数据；

确定所述语音数据的语种特征；

利用预先建立的第一语种识别模型对所述语音数据的语种特征进行第一次识别，得到第一次语种识别结果；

当所述第一次语种识别结果不准确时，利用预先建立的第二语种识别模型对所述语音数据的语种特征进行第二次识别，得到第二次语种识别结果；基于所述第一次语种识别结果和所述第二次语种识别结果，确定所述语音数据的语种；所述第二语种识别模型的网络层数多于所述第一语种识别模型。

可选地，所述确定所述语音数据的语种特征，包括：

获取所述语音数据的声学特征；

利用预先建立的语种特征提取模型的特征变换模块对所述语音数据的声学特征进行特征转换，得到变换后的特征；