[发明专利]一种多类型音频信号能量特征提取方法有效

申请号：	201910351459.9	申请日：	2019-04-28
公开（公告）号：	CN110322887B	公开（公告）日：	2021-10-15
发明（设计）人：	邓小涛;张华军;王征华;倪杰	申请（专利权）人：	武汉大晟极科技有限公司
主分类号：	G10L17/02	分类号：	G10L17/02
代理公司：	湖北武汉永嘉专利代理有限公司 42102	代理人：	王丹
地址：	430223 湖北省武汉市东湖***	国省代码：	湖北;42
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种类型音频信号能量特征提取方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种多类型音频信号能量特征提取方法，其特征在于：本方法包括以下步骤：

S1、数据采集：

令采样频率为f，采集说话人的音频信号值为s₁、s₂、s₃、……、s_n，其中n为采集的音频信号的采样数量；

S2、滤波：

对采集的说话人的音频信号值进行滤波处理，得到s′₁、s′₂、s′₃、……、s′_n；

S3、切片：

对s′₁、s′₂、s′₃、……、s′_n进行切片处理，按照每个切片包含l₁个采样点，每两个切片之间有l₂个采样点重复的原则进行切割，得到的切片个数为m＝floor((n-l₁)÷(l₁-l₂))+1，其中运算符号floor()表示对括号里面的数进行向下取整运算；进行切片处理后，得到m个长度为l₁个采样点的音频信号帧其中1≤i≤n-l₁+1，i为音频信号帧中每一个元素的序号，s′_i至为第i组音频信号帧中的第1至第l₁个元素；

S4、建立数组H，其中数组H的每一个元素H(i)的表达式计算方法为H(i)＝0.54-0.46×cos(2πi/(l₁-1))，其中0≤i≤l₁-1；

S5、将每一组音频信号帧与数组H相乘，得到局部被放大或者缩小的音频信号切片

S6、对音频信号切片进行幅频分析，得到l₁个频率、幅值数组对(f_k M_k)，其中0≤k≤l₁，计算每一种频率信号的能量大小P_k，计算公式为P_k＝M_k×M_k；

S7、生成j个一维数组，每一个数组包含l₁个元素，其中每一个数组包含三个位置特征f_pl、f_pc、f_pr，第t个数组中每一个元素值大小满足关系式：

公式(1)中t表示数组的序号，1≤t≤12，k表示数组中元素的序号，其中三个位置特征f_plt、f_pct、f_prt分别为第t个数组的位置特征f_pl、f_pc、f_pr，且均为预设值；

S8、将P_k分别与S7中的数组FA_t(k)相乘得到结果PFA_t(k)，将第t个数组PFA_t(k)中的l₁个元素相加，得到整个音频信号的第t个特征F_t，因此一个音频信号帧获得j个特征；

S9、将所有的m个音频信号帧的特征形成一个m行、j列的二维数组Feat，作为采集的音频信号的能量特征矩阵；Feat的第r行的j个元素为第r帧信号的j个特征值；

S10、将二维数组Feat的第r+1行数值减去第r行数值，得到音频信号每一帧之间能量的变化特征矩阵ΔFeat_r，其中1≤r≤m-1；

S11、将二维数组Feat的第c+1列数值减去第c列数值，得到每一个音频信号帧不同频率信号之间能量的变化特征矩阵ΔFeat_c，其中1≤c≤j-1。

2.根据权利要求1所述的多类型音频信号能量特征提取方法，其特征在于：所述的S2具体为：采用如下公式进行平滑滤波：s′_i＝s_i-α×s_i-1，其中α为平滑系数，0.95≤α≤0.97。

3.根据权利要求1所述的多类型音频信号能量特征提取方法，其特征在于：所述的j取12。

4.根据权利要求1所述的多类型音频信号能量特征提取方法，其特征在于：所述的l₁＝1102，l₂＝441。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于武汉大晟极科技有限公司，未经武汉大晟极科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201910351459.9/1.html，转载请声明来源钻瓜专利网。

上一篇：一种音频指纹提取方法及装置
下一篇：信用卡解锁方法、装置、设备及计算机可读存储介质

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L17-00 讲话者辨认或验证

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种多类型音频信号能量特征提取方法有效

专利文献下载