[发明专利]基于短时离散谐波变换的音色特征提取方法在审
申请号: | 201910881274.9 | 申请日: | 2019-09-18 |
公开(公告)号: | CN110570878A | 公开(公告)日: | 2019-12-13 |
发明(设计)人: | 李海峰;孙聪珊;杨婧;马琳;李洪伟;陈婧;薄洪健;丰上;熊文静 | 申请(专利权)人: | 哈尔滨工业大学 |
主分类号: | G10L25/18 | 分类号: | G10L25/18 |
代理公司: | 51241 成都方圆聿联专利代理事务所(普通合伙) | 代理人: | 李鹏 |
地址: | 150001 黑龙*** | 国省代码: | 黑龙;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 谐波结构 音色特征 信息提取 基音周期估计 互相关函数 基音周期 离散谐波 频域变换 信息冗余 音频信号 中心削波 三电平 稀疏性 谐波谱 构建 音色 | ||
本发明公开了一种基于短时离散谐波变换的音色特征提取方法,包括:用基于三电平中心削波互相关函数法提取基音周期估计值,并基于基音周期获得对音频信号的谐波结构信息进行提取的频域变换方法,进一步提取谐波结构信息,构建音色谐波谱特征,用于对音频音色特征的提取。本发明的优点是:可以解决现有技术中对音频谐波结构信息提取不足,且使用的相关音色特征数目庞大,信息冗余,效率低下的问题,获得具有稀疏性的音频谐波结构信息提取方法。
技术领域
本发明涉及信号处理技术领域,特别涉及一种音频信号音色特征提取方法。
背景技术
音色相关特征提取是音源识别的关键部分,对音源识别结果有重大影响。近年来,随着信号处理技术发展,音色相关特征提取方法不断增加,涉及时域、频域和倒谱域等。目前,在提取音色相关特征时,主要是将大量的时域、频域和倒谱域的声学特征进行组合,特征数目庞大,不仅加重了计算负担,也会造成信息的冗余。物体振动产生一组按音高顺序排列而成的谐波序列,人耳通过耳蜗基底膜对接收到的不同谐波序列进行分析与合成,再经过大脑的感受判断得到不同的音色和音高。谐波序列的变化对音色的影响最大。目前,很多方法并没有从音频信号的谐波对音色的物理意义角度挖掘音色的本质特征。因此,为了进一步提升音源识别的准确率和效率,需要找到一种表达简单且描述准确的音色特征提取方法。
发明内容
本发明针对现有技术的缺陷,提供了一种基于短时离散谐波变换的音色特征提取方法,解决了现有技术中存在的缺陷。
为了实现以上发明目的,本发明采取的技术方案如下:
a.短时离散谐波变换方法
基于谐波结构理论,根据音源的物理特性:物体振动发出的音频是复音,即具有谐波结构,且每个复音均有一个基频f0,它是谐波谱的最小频率,不同音频的基音不同其f0也不同。用频率序列来表示复音的谐波结构,将谐音按频率由低到高的顺序编号,使用向量HS=(f0,f1,...,fm,...,fM)保存谐波谱的各次谐波频率值,M是最高谐波次数。谐波谱中第m条谱线所对应的模拟频率(中心频率)为:
fm=f0·m (1)
其中相邻谐波谱对应的带宽为:
Bm=fm+1-fm=f0 (2)
由此可以看出任意相邻谱线的间隔(带宽)为一个常值,此时中心频率和带宽的比值pm为中心频率对应的谱线次序:
pm=fm/Bm=m (3)
设信号的采样频率为fs。T0为谐波谱的基音频率f0对应的基音周期,则满足:
T0=fs/f0 (4)
若信号最高频率分量为fmax,则至少满足以下关系,才不会产生混叠失真。
fs≥2fmax (5)
折叠频率(fs/2)是能够分析模拟信号的最高频率。又因为在谐波谱中:
fmax≥M·f0 (6)
由于最高谐波次数M为一个整数,所以向下取整得到:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学,未经哈尔滨工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910881274.9/2.html,转载请声明来源钻瓜专利网。