[发明专利]一种多类型音频信号能量特征提取方法有效
申请号: | 201910351459.9 | 申请日: | 2019-04-28 |
公开(公告)号: | CN110322887B | 公开(公告)日: | 2021-10-15 |
发明(设计)人: | 邓小涛;张华军;王征华;倪杰 | 申请(专利权)人: | 武汉大晟极科技有限公司 |
主分类号: | G10L17/02 | 分类号: | G10L17/02 |
代理公司: | 湖北武汉永嘉专利代理有限公司 42102 | 代理人: | 王丹 |
地址: | 430223 湖北省武汉市东湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种多类型音频信号能量特征提取方法,选取采样频率,采集说话人的音频信号值;对采集的说话人的音频信号值进行滤波和切片处理,得到若干个一定长度的音频信号帧;建立数组;将每一组音频信号帧与数组相乘,得到局部被放大或者缩小的音频信号切片;对音频信号切片进行幅频分析,计算每一种频率信号的能量;生成一维数组;将所有的音频信号帧的特征形成一个二维数组,作为采集的音频信号的能量特征矩阵;依据该能量特征矩阵得到音频信号每一帧之间能量的变化特征矩阵和不同频率信号之间能量的变化特征矩阵。本发明能获得更加丰富的音频信号能量特征。 | ||
搜索关键词: | 一种 类型 音频 信号 能量 特征 提取 方法 | ||
【主权项】:
1.一种多类型音频信号能量特征提取方法,其特征在于:本方法包括以下步骤:S1、数据采集:令采样频率为f,采集说话人的音频信号值为s1、s2、s3、……、sn,其中n为采集的音频信号的采样数量;S2、滤波:对采集的说话人的音频信号值进行滤波处理,得到s′1、s′2、s′3、……、s′n;S3、切片:对s′1、s′2、s′3、……、s′n进行切片处理,按照每个切片包含l1个采样点,每两个切片之间有l2个采样点重复的原则进行切割,得到的切片个数为m=floor((n‑l1)÷(l1‑l2))+1,其中运算符号floor()表示对括号里面的数进行向下取整运算;进行切片处理后,得到m个长度为l1个采样点的音频信号帧其中1≤i≤n‑l1+1,i为音频信号帧中每一个元素的序号,s′i至为第i组音频信号帧中的第1至第l1个元素;S4、建立数组H,其中数组H的每一个元素H(i)的表达式计算方法为H(i)=0.54‑0.46×cos(2πi/(l1‑1)),其中0≤i≤l1‑1;S5、将每一组音频信号帧与数组H相乘,得到局部被放大或者缩小的音频信号切片S6、对音频信号切片进行幅频分析,得到l1个频率、幅值数组对(fk Mk),其中0≤k≤l1,计算每一种频率信号的能量大小Pk,计算公式为Pk=Mk×Mk;S7、生成j个一维数组,每一个数组包含l1个元素,其中每一个数组包含三个位置特征fpl、fpc、fpr,第t个数组中每一个元素值大小满足关系式:公式(1)中t表示数组的序号,1≤t≤12,k表示数组中元素的序号,其中三个位置特征fplt、fpct、fprt分别为第t个数组的位置特征fpl、fpc、fpr,且均为预设值;S8、将Pk分别与S7中的数组FAt(k)相乘得到结果PFAt(k),将第t个数组PFAt(k)中的l1个元素相加,得到整个音频信号的第t个特征Ft,因此一个音频信号帧获得j个特征;S9、将所有的m个音频信号帧的特征形成一个m行、j列的二维数组Feat,作为采集的音频信号的能量特征矩阵;Feat的第r行的j个元素为第r帧信号的j个特征值;S10、将二维数组Feat的第r+1行数值减去第r行数值,得到音频信号每一帧之间能量的变化特征矩阵ΔFeatr,其中1≤r≤m‑1;S11、将二维数组Feat的第c+1列数值减去第c列数值,得到每一个音频信号帧不同频率信号之间能量的变化特征矩阵ΔFeatc,其中1≤c≤j‑1。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大晟极科技有限公司,未经武汉大晟极科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910351459.9/,转载请声明来源钻瓜专利网。