[发明专利]基于QMDCT系数的AAC音频重压缩检测方法有效

专利信息
申请号: 201810535084.7 申请日: 2018-05-30
公开(公告)号: CN108877816B 公开(公告)日: 2022-12-27
发明(设计)人: 王让定;黄其娟;严迪群;张坚 申请(专利权)人: 宁波大学
主分类号: G10L19/008 分类号: G10L19/008;G10L25/51
代理公司: 宁波奥圣专利代理有限公司 33226 代理人: 周珏
地址: 315211 浙*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种基于QMDCT系数的AAC音频重压缩检测方法,其获得不同比特率的单压缩AAC音频和双压缩AAC音频;通过移除采样点获得单压缩移除采样点AAC音频和双压缩移除采样点AAC音频;根据单压缩AAC音频和对应的单压缩移除采样点AAC音频各自的QMDCT系数分布直方图,得到相应的特征向量;并根据双压缩AAC音频和对应的双压缩移除采样点AAC音频各自的QMDCT系数分布直方图,得到相应的特征向量;根据同比特率的单压缩AAC音频和双压缩AAC音频的特征向量,训练LIBSVM分类器;测试时根据待重压缩检测AAC音频的比特率输入到相应的训练好的LIBSVM分类器中得到检测结果;优点是能实现低码率转高码率重压缩及同码率重压缩的AAC音频的有效检测,且检测准确率高、计算复杂度较低,鲁棒性较强。
搜索关键词: 基于 qmdct 系数 aac 音频 压缩 检测 方法
【主权项】:
1.一种基于QMDCT系数的AAC音频重压缩检测方法,其特征在于包括以下步骤:步骤一:随机选取No个时长一致而风格不同的原始音频,原始音频的格式为WAV格式;然后使用AAC编码器并采用Nb种比特率,分别对每个原始音频进行压缩,得到Nb类具有不同比特率的共N1个单压缩AAC音频;接着使用AAC解码器,对每个单压缩AAC音频进行解压,得到每个单压缩AAC音频对应的解压音频,解压音频的格式为WAV格式;再使用相同的AAC编码器并采用Nb种比特率中大于或等于获取对应的单压缩AAC音频时所采用的比特率的所有比特率,分别对每个单压缩AAC音频对应的解压音频进行压缩,得到类共N2个双压缩AAC音频;其中,No≥100,原始音频的时长为大于或等于1秒,Nb≥1,N1=No×Nb步骤二:使用与步骤一中相同的AAC解码器对每个单压缩AAC音频进行解压,得到每个单压缩AAC音频对应的WAV音频;然后针对每个单压缩AAC音频对应的WAV音频,从其起始位置开始移除Nremove个采样点,得到每个单压缩AAC音频对应的移除采样点后的WAV音频;再使用与步骤一中相同的AAC编码器并采用获取对应的单压缩AAC音频时所采用的比特率,对每个单压缩AAC音频对应的移除采样点后的WAV音频进行压缩,得到每个单压缩AAC音频相应的单压缩移除采样点AAC音频;其中,1≤Nremove<1024;使用与步骤一中相同的AAC解码器对每个双压缩AAC音频进行解压,得到每个双压缩AAC音频对应的WAV音频;然后针对每个双压缩AAC音频对应的WAV音频,从其起始位置开始移除Nremove个采样点,得到每个双压缩AAC音频对应的移除采样点后的WAV音频;再使用与步骤一中相同的AAC编码器并采用获取对应的双压缩AAC音频时第二次压缩所采用的比特率,对每个双压缩AAC音频对应的移除采样点后的WAV音频进行压缩,得到每个双压缩AAC音频相应的双压缩移除采样点AAC音频;步骤三:提取每个单压缩AAC音频及其相应的单压缩移除采样点AAC音频各自的QMDCT系数矩阵,将第n1个单压缩AAC音频的QMDCT系数矩阵记为将第n1个单压缩AAC音频相应的单压缩移除采样点AAC音频的QMDCT系数矩阵记为然后获取每个单压缩AAC音频的QMDCT系数矩阵中QMDCT系数的值在范围内的QMDCT系数分布直方图,并获取每个单压缩AAC音频相应的单压缩移除采样点AAC音频的QMDCT系数矩阵中QMDCT系数的值在范围内的QMDCT系数分布直方图,将中QMDCT系数的值在范围内的QMDCT系数分布直方图记为中QMDCT系数的值在范围内的QMDCT系数分布直方图记为再通过计算每个单压缩AAC音频的QMDCT系数矩阵对应的QMDCT系数分布直方图中的每个元素的值与该单压缩AAC音频相应的单压缩移除采样点AAC音频的QMDCT系数矩阵对应的QMDCT系数分布直方图中的相同位置的元素的值的差值,获取每个单压缩AAC音频的特征向量,将第n1个单压缩AAC音频的特征向量记为其中,n1为正整数,1≤n1≤N1的维数均为M×1024,M表示原始音频中包含的帧的总帧数,表示中下标为(1,1)的QMDCT系数,亦表示第n1个单压缩AAC音频中的第1帧中的第1个采样点的QMDCT系数,表示中下标为(1,1024)的QMDCT系数,亦表示第n1个单压缩AAC音频中的第1帧中的第1024个采样点的QMDCT系数,表示中下标为(M,1)的QMDCT系数,亦表示第n1个单压缩AAC音频中的第M帧中的第1个采样点的QMDCT系数,表示中下标为(M,1024)的QMDCT系数,亦表示第n1个单压缩AAC音频中的第M帧中的第1024个采样点的QMDCT系数,表示中下标为(1,1)的QMDCT系数,亦表示第n1个单压缩AAC音频相应的单压缩移除采样点AAC音频中的第1帧中的第1个采样点的QMDCT系数,表示中下标为(1,1024)的QMDCT系数,亦表示第n1个单压缩AAC音频相应的单压缩移除采样点AAC音频中的第1帧中的第1024个采样点的QMDCT系数,表示中下标为(M,1)的QMDCT系数,亦表示第n1个单压缩AAC音频相应的单压缩移除采样点AAC音频中的第M帧中的第1个采样点的QMDCT系数,表示中下标为(M,1024)的QMDCT系数,亦表示第n1个单压缩AAC音频相应的单压缩移除采样点AAC音频中的第M帧中的第1024个采样点的QMDCT系数,的下限值,的上限值,的维数为符号“||”为取绝对值符号,表示中的第1个元素的值,表示中的第个元素的值,表示中的第1个元素的值,表示中的第个元素的值;提取每个双压缩AAC音频及其相应的双压缩移除采样点AAC音频各自的QMDCT系数矩阵,将第n2个双压缩AAC音频的QMDCT系数矩阵记为将第n2个双压缩AAC音频相应的双压缩移除采样点AAC音频的QMDCT系数矩阵记为然后获取每个双压缩AAC音频的QMDCT系数矩阵中QMDCT系数的值在范围内的QMDCT系数分布直方图,并获取每个双压缩AAC音频相应的双压缩移除采样点AAC音频的QMDCT系数矩阵中QMDCT系数的值在范围内的QMDCT系数分布直方图,将中QMDCT系数的值在范围内的QMDCT系数分布直方图记为中QMDCT系数的值在范围内的QMDCT系数分布直方图记为再通过计算每个双压缩AAC音频的QMDCT系数矩阵对应的QMDCT系数分布直方图中的每个元素的值与该双压缩AAC音频相应的双压缩移除采样点AAC音频的QMDCT系数矩阵对应的QMDCT系数分布直方图中的相同位置的元素的值的差值,获取每个双压缩AAC音频的特征向量,将第n2个双压缩AAC音频的特征向量记为其中,n2为正整数,1≤n2≤N2的维数均为M×1024,表示中下标为(1,1)的QMDCT系数,亦表示第n2个双压缩AAC音频中的第1帧中的第1个采样点的QMDCT系数,表示中下标为(1,1024)的QMDCT系数,亦表示第n2个双压缩AAC音频中的第1帧中的第1024个采样点的QMDCT系数,表示中下标为(M,1)的QMDCT系数,亦表示第n2个双压缩AAC音频中的第M帧中的第1个采样点的QMDCT系数,表示中下标为(M,1024)的QMDCT系数,亦表示第n2个双压缩AAC音频中的第M帧中的第1024个采样点的QMDCT系数,表示中下标为(1,1)的QMDCT系数,亦表示第n2个双压缩AAC音频相应的双压缩移除采样点AAC音频中的第1帧中的第1个采样点的QMDCT系数,表示中下标为(1,1024)的QMDCT系数,亦表示第n2个双压缩AAC音频相应的双压缩移除采样点AAC音频中的第1帧中的第1024个采样点的QMDCT系数,表示中下标为(M,1)的QMDCT系数,亦表示第n2个双压缩AAC音频相应的双压缩移除采样点AAC音频中的第M帧中的第1个采样点的QMDCT系数,表示中下标为(M,1024)的QMDCT系数,亦表示第n2个双压缩AAC音频相应的双压缩移除采样点AAC音频中的第M帧中的第1024个采样点的QMDCT系数,的维数为符号“||”为取绝对值符号,表示中的第1个元素的值,表示中的第个元素的值,表示中的第1个元素的值,表示中的第个元素的值;步骤四:从每类所有的单压缩AAC音频中随机选取一部分单压缩AAC音频,并从每类所有的双压缩AAC音频中随机选取一部分双压缩AAC音频;然后将选取的所有单压缩AAC音频和选取的所有双压缩AAC音频构成训练集,将剩余的所有单压缩AAC音频和剩余的所有双压缩AAC音频构成测试集;步骤五:训练Nb个LIBSVM分类器,训练第nb个LIBSVM分类器的具体过程为:将训练集中的第nb类的所有单压缩AAC音频的特征向量,及第二次压缩所采用的比特率与获取对应的第nb类的单压缩AAC音频时所采用的比特率相同的所有双压缩AAC音频的特征向量,输入到LIBSVM分类器中进行训练,得到适用于采用第nb种比特率的AAC音频的训练好的第nb个LIBSVM分类器;其中,nb为正整数,1≤nb≤Nb;步骤六:将测试集中的每个单压缩AAC音频或每个双压缩AAC音频作为待重压缩检测AAC音频;然后根据待重压缩检测AAC音频的公开的比特率,将待重压缩检测AAC音频的特征向量输入到相应的训练好的LIBSVM分类器中,得到用于代表检测结果为单压缩AAC音频的数字标记1或用于代表检测结果为双压缩AAC音频的数字标记0。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宁波大学,未经宁波大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201810535084.7/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top