[发明专利]一种多类型音频信号能量特征提取方法有效
申请号: | 201910351459.9 | 申请日: | 2019-04-28 |
公开(公告)号: | CN110322887B | 公开(公告)日: | 2021-10-15 |
发明(设计)人: | 邓小涛;张华军;王征华;倪杰 | 申请(专利权)人: | 武汉大晟极科技有限公司 |
主分类号: | G10L17/02 | 分类号: | G10L17/02 |
代理公司: | 湖北武汉永嘉专利代理有限公司 42102 | 代理人: | 王丹 |
地址: | 430223 湖北省武汉市东湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 类型 音频 信号 能量 特征 提取 方法 | ||
1.一种多类型音频信号能量特征提取方法,其特征在于:本方法包括以下步骤:
S1、数据采集:
令采样频率为f,采集说话人的音频信号值为s1、s2、s3、……、sn,其中n为采集的音频信号的采样数量;
S2、滤波:
对采集的说话人的音频信号值进行滤波处理,得到s′1、s′2、s′3、……、s′n;
S3、切片:
对s′1、s′2、s′3、……、s′n进行切片处理,按照每个切片包含l1个采样点,每两个切片之间有l2个采样点重复的原则进行切割,得到的切片个数为m=floor((n-l1)÷(l1-l2))+1,其中运算符号floor()表示对括号里面的数进行向下取整运算;进行切片处理后,得到m个长度为l1个采样点的音频信号帧其中1≤i≤n-l1+1,i为音频信号帧中每一个元素的序号,s′i至为第i组音频信号帧中的第1至第l1个元素;
S4、建立数组H,其中数组H的每一个元素H(i)的表达式计算方法为H(i)=0.54-0.46×cos(2πi/(l1-1)),其中0≤i≤l1-1;
S5、将每一组音频信号帧与数组H相乘,得到局部被放大或者缩小的音频信号切片
S6、对音频信号切片进行幅频分析,得到l1个频率、幅值数组对(fk Mk),其中0≤k≤l1,计算每一种频率信号的能量大小Pk,计算公式为Pk=Mk×Mk;
S7、生成j个一维数组,每一个数组包含l1个元素,其中每一个数组包含三个位置特征fpl、fpc、fpr,第t个数组中每一个元素值大小满足关系式:
公式(1)中t表示数组的序号,1≤t≤12,k表示数组中元素的序号,其中三个位置特征fplt、fpct、fprt分别为第t个数组的位置特征fpl、fpc、fpr,且均为预设值;
S8、将Pk分别与S7中的数组FAt(k)相乘得到结果PFAt(k),将第t个数组PFAt(k)中的l1个元素相加,得到整个音频信号的第t个特征Ft,因此一个音频信号帧获得j个特征;
S9、将所有的m个音频信号帧的特征形成一个m行、j列的二维数组Feat,作为采集的音频信号的能量特征矩阵;Feat的第r行的j个元素为第r帧信号的j个特征值;
S10、将二维数组Feat的第r+1行数值减去第r行数值,得到音频信号每一帧之间能量的变化特征矩阵ΔFeatr,其中1≤r≤m-1;
S11、将二维数组Feat的第c+1列数值减去第c列数值,得到每一个音频信号帧不同频率信号之间能量的变化特征矩阵ΔFeatc,其中1≤c≤j-1。
2.根据权利要求1所述的多类型音频信号能量特征提取方法,其特征在于:所述的S2具体为:采用如下公式进行平滑滤波:s′i=si-α×si-1,其中α为平滑系数,0.95≤α≤0.97。
3.根据权利要求1所述的多类型音频信号能量特征提取方法,其特征在于:所述的j取12。
4.根据权利要求1所述的多类型音频信号能量特征提取方法,其特征在于:所述的l1=1102,l2=441。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大晟极科技有限公司,未经武汉大晟极科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910351459.9/1.html,转载请声明来源钻瓜专利网。