[发明专利]用于音频特征提取的倒谱方差归一化有效
申请号: | 201480083583.7 | 申请日: | 2014-12-22 |
公开(公告)号: | CN107112011B | 公开(公告)日: | 2021-11-09 |
发明(设计)人: | A.马雷克;T.博克莱特 | 申请(专利权)人: | 英特尔公司;A·马雷克 |
主分类号: | G10L15/20 | 分类号: | G10L15/20;G10L17/02;G10L17/20 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 徐红燕;杜荔南 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 音频 特征 提取 方差 归一化 | ||
1.一种用于音频处理的方法,包括:
接收来自麦克风的数字化音频的帧序列;
归一化针对所述帧序列的第一帧的第一特征向量,所述第一特征向量使用初始均值和初始方差来确定;
使用针对所述第一帧的所归一化的第一特征向量来将所述初始均值更新为均值μ(1);
使用所述均值μ(1)和针对所述第一帧的所归一化的第一特征向量来将所述初始方差更新为方差σ(1);
针对所述帧序列的帧迭代地执行以下(1)和(2):
(1)在第i次迭代处,使用(a)均值μ(i-1)、(b)方差σ(i-1)和(c)所述帧序列的第i个帧来归一化第i个特征向量,其中所述均值μ(i-1)和所述方差σ(i-1)是基于第(i-1)个特征向量来在紧接着前面第(i-1)次迭代处确定的,并且其中i = 2、……、N,其中N是所述帧序列中的帧的数目,和
(2)在第i次迭代处且在归一化所述第i个特征向量之后,基于所归一化的第i个特征向量来确定均值μ(i)和方差σ(i);以及
将所归一化的特征向量发送到音频处理流水线的识别级。
2.根据权利要求1所述的方法,还包括:将所述初始均值和所述初始方差设置为针对所述数字化音频的估计值。
3.根据权利要求1或2所述的方法,其中,如果不存在针对均值和方差的初始化,则基于针对所述第一帧所确定的特征向量来建立所述初始均值和所述初始方差。
4.根据权利要求1或2所述的方法,其中,确定特征向量包括确定梅尔频率倒谱系数。
5.根据权利要求4所述的方法,其中,所述均值μ(i)包括倒谱均值,并且所述方差σ(i)包括倒谱方差。
6.根据权利要求5所述的方法,其中,归一化特征向量包括确定倒谱均值减法和倒谱方差归一化。
7.根据权利要求1或2所述的方法,其中,所述数字化音频是语音。
8.根据权利要求7所述的方法,其中,所述识别级包括解码器,所述方法还包括在所述解码器处接收所归一化的特征向量,并在所述解码器处确定所述语音是否与经认证的用户匹配。
9.根据权利要求1或2所述的方法,其中,基于所述均值μ(i-1)和所归一化的第i个特征向量来确定所述均值μ(i)。
10.根据权利要求9所述的方法,其中,基于所述均值μ(i)、所述方差σ(i-1)和所归一化的第i个特征向量来确定所述方差σ(i)。
11.一种用于音频处理的装备,包括:
一个或多个处理器;
特征提取器,可由所述一个或多个处理器执行以:
通过模数转换器接收来自麦克风的数字化音频的帧序列,
确定和归一化针对所述帧序列的第一帧的第一特征向量,所归一化的第一特征向量使用初始均值和初始方差来确定,
在确定和归一化所述第一特征向量之后,基于所归一化的第一特征向量来确定第一均值,并基于所述第一均值和所归一化的第一特征向量来确定第一方差,
确定和归一化针对所述帧序列的第二帧的第二特征向量,所归一化的第二特征向量使用所述第一均值和所述第一方差来确定,和
在确定和归一化所述第二特征向量之后,基于所归一化的第二特征向量来确定第二均值,并基于所述第二均值和所归一化的第二特征向量来确定第二方差;以及
识别级,用于识别所归一化的特征向量。
12.根据权利要求11所述的装备,其中,所述数字化音频是语音。
13.根据权利要求12所述的装备,其中,所述识别级包括解码器,所述解码器接收所归一化的特征向量并确定所述语音是否与经认证的用户匹配。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司;A·马雷克,未经英特尔公司;A·马雷克许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201480083583.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:复合锂离子电池三元正极材料及其制备方法
- 下一篇:瓶贴(食用油)