[发明专利]数字音频波形突变的检测方法有效
申请号: | 201410285152.0 | 申请日: | 2014-06-24 |
公开(公告)号: | CN104021791B | 公开(公告)日: | 2017-02-22 |
发明(设计)人: | 徐晶 | 申请(专利权)人: | 贵州大学 |
主分类号: | G10L19/00 | 分类号: | G10L19/00;G10L25/60 |
代理公司: | 贵阳中新专利商标事务所52100 | 代理人: | 李亮,程新敏 |
地址: | 550025 贵州省贵*** | 国省代码: | 贵州;52 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种音频波形突变的检测方法,根据音频波形突变引起语谱出现脊峰的特点而提出的统计判别方法,属于多媒体信息安全领域。本发明方法针对数字音频由于复制粘贴操作的波形突变检测,分析语谱对数域中音频拼接点前后的脊峰跨度变化,构造脊峰因子描述一帧音频对数语谱的脊峰带宽以表征短时能量变化特点,并利用差分算子区分音频的突然声响与音频波形突变造成的脊峰因子识别。本发明方法包括以下步骤将音频信号进行短时傅里叶变换,及对数变换,得到对数域的音频语谱;计算语谱中每帧的脊线因子;对脊线因子进行差分变换结果做检测判断。本发明能较有效地对音频波形突变进行识别,为数字音频编辑操作边界的检测提供了一个有效的方法。 | ||
搜索关键词: | 数字音频 波形 突变 检测 方法 | ||
【主权项】:
一种数字音频波形突变的检测方法,其特征在于:包括以下步骤:1)将音频信号变换得到对数域的音频语谱Y,将获得的音频语谱进行对数变换,得到对数语谱G;2)进行对数语谱G能量二值化计算;3)计算每帧对数语谱Gt的音频突变系数σt;4)对音频突变系数σt进行判断,进行音频波形突变检测和突变区域定位;步骤1)所述的将音频信号变换得到对数域的音频语谱Y,将获得的音频语谱进行对数变换,得到对数语谱G,具体是,对于长度为h的数字音频信号y进行分帧,得到帧数为Nl,帧长为2*N的矩阵;加入窗函数并进行短时傅里叶变换,得到大小为N*N1的音频语谱Y;对音频语谱Y进行对数变换,得到对数语谱G,其大小为N*N1;步骤2)所述的进行对数语谱G能量二值化计算,具体是,先计算得到对数语谱G中的最大值Gmax和最小值Gmin,设每帧频率的能量值为Gti(1≤t≤N,1≤i≤Nl),通过如下公式(1)计算能量二值化值δ(t,i),其中λ为阈值因子;步骤3)所述的计算每帧对数语谱Gt的音频突变系数,具体是,通过公式(2)计算音频突变系数σt(1≤t≤N1);σt=Σi=1nδ(t,i)n---(2);]]>步骤4)所述的对音频突变系数σt进行判断,进行音频波形突变检测和突变区域定位,具体是,假设在步骤3)中得到了对数语谱G第i帧Gi及相邻帧的三个音频突变系数σi‑1、σi、σi+1,若满足:σi>0.85且|σi‑σi‑1|*|σi‑σi+1|>σi/16则确定音频中存在音频突变,其中第i帧Gi是检测到的音频波形突变区域。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于贵州大学,未经贵州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410285152.0/,转载请声明来源钻瓜专利网。