[发明专利]用于音频特征提取的倒谱方差归一化有效

申请号：	201480083583.7	申请日：	2014-12-22
公开（公告）号：	CN107112011B	公开（公告）日：	2021-11-09
发明（设计）人：	A.马雷克;T.博克莱特	申请（专利权）人：	英特尔公司;A·马雷克
主分类号：	G10L15/20	分类号：	G10L15/20;G10L17/02;G10L17/20
代理公司：	中国专利代理(香港)有限公司 72001	代理人：	徐红燕;杜荔南
地址：	美国加利***	国省代码：	暂无信息
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	用于音频特征提取方差归一化
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种用于音频处理的方法，包括：

接收来自麦克风的数字化音频的帧序列；

归一化针对所述帧序列的第一帧的第一特征向量，所述第一特征向量使用初始均值和初始方差来确定；

使用针对所述第一帧的所归一化的第一特征向量来将所述初始均值更新为均值μ(1)；

使用所述均值μ(1)和针对所述第一帧的所归一化的第一特征向量来将所述初始方差更新为方差σ(1)；

针对所述帧序列的帧迭代地执行以下（1）和（2）：

（1）在第i次迭代处，使用（a）均值μ(i-1)、（b）方差σ(i-1)和（c）所述帧序列的第i个帧来归一化第i个特征向量，其中所述均值μ(i-1)和所述方差σ(i-1)是基于第（i-1）个特征向量来在紧接着前面第（i-1）次迭代处确定的，并且其中i = 2、……、N，其中N是所述帧序列中的帧的数目，和

（2）在第i次迭代处且在归一化所述第i个特征向量之后，基于所归一化的第i个特征向量来确定均值μ(i)和方差σ(i)；以及

将所归一化的特征向量发送到音频处理流水线的识别级。

2.根据权利要求1所述的方法，还包括：将所述初始均值和所述初始方差设置为针对所述数字化音频的估计值。

3.根据权利要求1或2所述的方法，其中，如果不存在针对均值和方差的初始化，则基于针对所述第一帧所确定的特征向量来建立所述初始均值和所述初始方差。

4.根据权利要求1或2所述的方法，其中，确定特征向量包括确定梅尔频率倒谱系数。

5.根据权利要求4所述的方法，其中，所述均值μ(i)包括倒谱均值，并且所述方差σ(i)包括倒谱方差。

6.根据权利要求5所述的方法，其中，归一化特征向量包括确定倒谱均值减法和倒谱方差归一化。

7.根据权利要求1或2所述的方法，其中，所述数字化音频是语音。

8.根据权利要求7所述的方法，其中，所述识别级包括解码器，所述方法还包括在所述解码器处接收所归一化的特征向量，并在所述解码器处确定所述语音是否与经认证的用户匹配。

9.根据权利要求1或2所述的方法，其中，基于所述均值μ(i-1)和所归一化的第i个特征向量来确定所述均值μ(i)。

10.根据权利要求9所述的方法，其中，基于所述均值μ(i)、所述方差σ(i-1)和所归一化的第i个特征向量来确定所述方差σ(i)。

11.一种用于音频处理的装备，包括：