[发明专利]音频特征提取方法及装置有效
申请号: | 201710839230.0 | 申请日: | 2017-09-18 |
公开(公告)号: | CN107452399B | 公开(公告)日: | 2020-09-15 |
发明(设计)人: | 赵伟峰 | 申请(专利权)人: | 腾讯音乐娱乐科技(深圳)有限公司 |
主分类号: | G10L25/45 | 分类号: | G10L25/45;G10L25/21;G10L25/78 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 郭晶 |
地址: | 518000 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 特征 提取 方法 装置 | ||
1.一种音频特征提取方法,其特征在于,所述方法包括:
通过窗长为M的窗函数将音频信号分为多帧,得到样本信号,所述M为自然数;
按照预定规则从所述样本信号中选取出两个信号帧,将所述两个信号帧对应的能量值分别确定为第一能量区间的上限值和下限值,并从所述样本信号中筛选出对应的能量值处于所述第一能量区间的信号帧;
对所述样本信号取绝对值得到正样本信号,将所述正样本信号中对应的能量值最大的信号帧确定为符合预定条件的信号帧,并根据所述符合预定条件的信号帧对应的能量值确定第二能量区间的上限值和下限值;
在所述筛选出的信号帧中,将对应的能量值处于所述第二能量区间的信号帧确定为所述音频信号的特征帧;
所述根据所述符合预定条件的信号帧对应的能量值确定第二能量区间,包括:
将确定出的信号帧对应的能量值减去第一预值得到第一数值,将所述确定出的信号帧对应的能量值乘以第二预值得到第二数值;
在所述第一数值与所述第二数值中,将能量值大的数值确定为所述第二能量区间的上限值,将所述能量值大的数值对应的负值确定为所述第二能量区间的下限值。
2.根据权利要求1所述的方法,其特征在于,所述通过窗长为M的窗函数将音频信号分为多帧,得到样本信号,包括:
对所述音频信号进行傅里叶变换,得到音频信号对应的时域信号;
按照归一化公式,对所述时域信号进行归一化处理;
通过窗长为M的窗函数将归一化处理后的时域信号分为多帧,得到样本信号;
其中,所述归一化公式为:
其中,所述y(i)为第i个归一化处理后的时域信号,所述x(i)为第i个时域信号帧,xmax为取绝对值后的所述时域信号中,采样值最大的时域信号帧对应的采样值。
3.根据权利要求1所述的方法,其特征在于,所述通过窗长为M的窗函数将音频信号分为多帧,得到样本信号,包括:
按照窗长为M的窗函数对应的加窗公式,将所述音频信号分为多帧,得到所述样本信号;
其中,所述加窗公式为:
xw(n)=w(n)*x(n),
其中,所述xw(n)为样本信号,所述xw(n)的帧数为L,所述x(n)为所述音频信号,所述w(n)为窗函数,所述n小于且等于N的自然数,所述L=N/M。
4.根据权利要求1所述的方法,其特征在于,所述按照预定规则从所述样本信号中选取出两个信号帧,将所述两个信号帧对应的能量值分别确定为第一能量区间的上限值和下限值,并从所述样本信号中筛选出对应的能量值处于所述第一能量区间的信号帧,包括:
计算所述样本信号中每一个信号帧的能量值;
按照预定顺序对所述样本信号中的信号帧进行排序,得到信号帧序列;
从所述信号帧序列中选取出第个信号帧和第个信号帧,将所述第个信号帧对应的能量值与所述第个信号帧对应的能量值中,能量值大的信号帧对应的能量值确定为所述第一能量区间的上限值,能量值小的信号帧对应的能量值确定为所述第一能量区间的下限值,所述R为正小数;
在所述样本信号中筛选出对应的能量值处于所述第一能量区间的信号帧。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯音乐娱乐科技(深圳)有限公司,未经腾讯音乐娱乐科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710839230.0/1.html,转载请声明来源钻瓜专利网。