[发明专利]基于音素对数似然比和稀疏表征的快速语种识别方法有效

专利信息
申请号: 202010244101.9 申请日: 2020-03-31
公开(公告)号: CN111462729B 公开(公告)日: 2022-05-17
发明(设计)人: 刘文龙;江海;王化;刘俊南 申请(专利权)人: 因诺微科技(天津)有限公司
主分类号: G10L15/00 分类号: G10L15/00;G10L15/02;G10L15/06;G10L15/14;G10L15/16;G10L21/02;G10L21/0216;G10L25/24;G10L25/30;G10L25/87
代理公司: 天津市北洋有限责任专利代理事务所 12201 代理人: 李素兰
地址: 300392 天津市滨海新区华苑产业*** 国省代码: 天津;12
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 音素 对数 稀疏 表征 快速 语种 识别 方法
【说明书】:

发明公开了一种基于音素对数似然比和稀疏表征的快速语种识别方法,计算输入给定语音信号的音素对数似然概率特征,基于该特征利用通过稀疏表征方法改进的快速语种识别系统确定所述给定语音信号所属的语种。与现有技术相比,本发明1)可以压缩系统模型,更加便利适配于各种运算和存储受限的设备需要;2)提升系统的鲁棒性;3)能够快速实现所属的语种的智能识别。

技术领域

本发明涉及语音识别技术领域,特别涉及一种基于语音技术的语种识别方法。

背景技术

随着科技的高速发展,信息的快速流通和交互越来越便利,但在便利的同时又带来了某些负面影响,如何保证信息安全是一个新挑战。我国是一个多民族的国家,对于不同语种依靠人力很难分析,而语种识别技术的出现为这个问题的解决提供了新的思路。语种识别是语音识别领域的一个重要分支,是计算机分析处理一段语音自动判别其所属语言类别的技术。

传统的语种识别技术包括语音信号检测和预处理、语音信号特征提取、声学模型以及判别模型等等。其中,1)语音信号检测和预处理是为了对语音信号数据进行前端预处理,包括去除背景静音和去除背景噪音两部分,其中去除背景静音采用的技术有基于SNR(信噪比)的VAD(噪音检测)方法、基于GMM(混合高斯模型)的VAD(噪音检测)方法等;去除背景噪音有小波去噪算法、基于深度学习的语音去噪算法等。2)语音信号特征提取是对语音信号进行提取数字特征以便计算机方便处理,一般有采用传统的MFCC(梅尔频率倒谱系数)特征、Fbank(滤波器组)特征以及基于深度神经网络音素识别器提取特征的方法等。3)声学模型是最关键的,有传统GMM-HMM(混合高斯模型-隐马尔可夫模型)、HMM-DNN(隐马尔可夫模型-深度神经网络模型)等。判别模型是对待识别的信息进行判别,有GMM-UBM(混合高斯模型-通用背景模型)模型、I-vector(辨别矢量)模型、PLDA(概率线性判别分析法)模型以及稀疏表征等。

现有技术中,在语种识别中的语音信号特征提取常采用MFCC(梅尔频率倒谱系数)或FBank(滤波器组)等方法,这些方法在理想环境下能取得较好效果,对于复杂环境的鲁棒性不是很好。

基于传统的语种识别往往对设备的计算和存储的要求较高,不利于普及的缺陷,因此需要新方法改进这个缺陷以便更好地适用于各种复杂环境。目前的现状是迫切需要提出改进的语种识别技术降低运算复杂度,以便适配各种设备。

发明内容

为了解决复杂环境的影响以及更加便利适配于各种运算和存储受限的设备需要,本发明提出一种基于音素对数似然比和稀疏表征的快速语种识别方法,首先在特征提取的阶段计算输入给定语音信号的音素对数似然概率特征,提升系统的鲁棒性,其次利用基于稀疏表征方法改进的快速语种识别系统的性能,使其达到给定语音信号,从而快速识别所属的语种。

本发明的一种基于音素对数似然比和稀疏表征的快速语种识别方法,该方法包括以下步骤:

步骤1、预处理:对作为训练数据集和测试数据集的输入语音数据进行预处理,包括特征提取、基于SNR(信噪比)的静音检测以及混合多环境混响的语音增强,本步骤具体包括以下处理:

1-1、通过对接收的输入语音信号提取声学特征,所述声学特征包括MFCC特征、FilterBank特征或PLP特征其中的任意一种;

1-2、对输入系统的训练和测试的语音数据进行基于信噪比SNR的静音检测处理,实现去除音频信号中的非语音段;

1-3、基于深度学习的噪声注入语音增强方法消除音频中的各类背景噪声;

步骤2、对经预处理模块后的语音信号通过音素识别器提取帧级别的音素后验概率向量;本步骤又包含如下两个步骤:

2-1、通过HMM-DNN模型将大量语料训练成提取语音音素对数似然比的音素识别器,得到如声学层特征类似的帧级别的特征,具体方法如下:

2-1-1、首先对该语料训练集提取声学特征;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于因诺微科技(天津)有限公司,未经因诺微科技(天津)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010244101.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top