[发明专利]基于QMDCT系数的AAC音频重压缩检测方法有效
申请号: | 201810535084.7 | 申请日: | 2018-05-30 |
公开(公告)号: | CN108877816B | 公开(公告)日: | 2022-12-27 |
发明(设计)人: | 王让定;黄其娟;严迪群;张坚 | 申请(专利权)人: | 宁波大学 |
主分类号: | G10L19/008 | 分类号: | G10L19/008;G10L25/51 |
代理公司: | 宁波奥圣专利代理有限公司 33226 | 代理人: | 周珏 |
地址: | 315211 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于QMDCT系数的AAC音频重压缩检测方法,其获得不同比特率的单压缩AAC音频和双压缩AAC音频;通过移除采样点获得单压缩移除采样点AAC音频和双压缩移除采样点AAC音频;根据单压缩AAC音频和对应的单压缩移除采样点AAC音频各自的QMDCT系数分布直方图,得到相应的特征向量;并根据双压缩AAC音频和对应的双压缩移除采样点AAC音频各自的QMDCT系数分布直方图,得到相应的特征向量;根据同比特率的单压缩AAC音频和双压缩AAC音频的特征向量,训练LIBSVM分类器;测试时根据待重压缩检测AAC音频的比特率输入到相应的训练好的LIBSVM分类器中得到检测结果;优点是能实现低码率转高码率重压缩及同码率重压缩的AAC音频的有效检测,且检测准确率高、计算复杂度较低,鲁棒性较强。 | ||
搜索关键词: | 基于 qmdct 系数 aac 音频 压缩 检测 方法 | ||
【主权项】:
1.一种基于QMDCT系数的AAC音频重压缩检测方法,其特征在于包括以下步骤:步骤一:随机选取No个时长一致而风格不同的原始音频,原始音频的格式为WAV格式;然后使用AAC编码器并采用Nb种比特率,分别对每个原始音频进行压缩,得到Nb类具有不同比特率的共N1个单压缩AAC音频;接着使用AAC解码器,对每个单压缩AAC音频进行解压,得到每个单压缩AAC音频对应的解压音频,解压音频的格式为WAV格式;再使用相同的AAC编码器并采用Nb种比特率中大于或等于获取对应的单压缩AAC音频时所采用的比特率的所有比特率,分别对每个单压缩AAC音频对应的解压音频进行压缩,得到类共N2个双压缩AAC音频;其中,No≥100,原始音频的时长为大于或等于1秒,Nb≥1,N1=No×Nb,步骤二:使用与步骤一中相同的AAC解码器对每个单压缩AAC音频进行解压,得到每个单压缩AAC音频对应的WAV音频;然后针对每个单压缩AAC音频对应的WAV音频,从其起始位置开始移除Nremove个采样点,得到每个单压缩AAC音频对应的移除采样点后的WAV音频;再使用与步骤一中相同的AAC编码器并采用获取对应的单压缩AAC音频时所采用的比特率,对每个单压缩AAC音频对应的移除采样点后的WAV音频进行压缩,得到每个单压缩AAC音频相应的单压缩移除采样点AAC音频;其中,1≤Nremove<1024;使用与步骤一中相同的AAC解码器对每个双压缩AAC音频进行解压,得到每个双压缩AAC音频对应的WAV音频;然后针对每个双压缩AAC音频对应的WAV音频,从其起始位置开始移除Nremove个采样点,得到每个双压缩AAC音频对应的移除采样点后的WAV音频;再使用与步骤一中相同的AAC编码器并采用获取对应的双压缩AAC音频时第二次压缩所采用的比特率,对每个双压缩AAC音频对应的移除采样点后的WAV音频进行压缩,得到每个双压缩AAC音频相应的双压缩移除采样点AAC音频;步骤三:提取每个单压缩AAC音频及其相应的单压缩移除采样点AAC音频各自的QMDCT系数矩阵,将第n1个单压缩AAC音频的QMDCT系数矩阵记为将第n1个单压缩AAC音频相应的单压缩移除采样点AAC音频的QMDCT系数矩阵记为然后获取每个单压缩AAC音频的QMDCT系数矩阵中QMDCT系数的值在范围内的QMDCT系数分布直方图,并获取每个单压缩AAC音频相应的单压缩移除采样点AAC音频的QMDCT系数矩阵中QMDCT系数的值在范围内的QMDCT系数分布直方图,将中QMDCT系数的值在范围内的QMDCT系数分布直方图记为将中QMDCT系数的值在范围内的QMDCT系数分布直方图记为再通过计算每个单压缩AAC音频的QMDCT系数矩阵对应的QMDCT系数分布直方图中的每个元素的值与该单压缩AAC音频相应的单压缩移除采样点AAC音频的QMDCT系数矩阵对应的QMDCT系数分布直方图中的相同位置的元素的值的差值,获取每个单压缩AAC音频的特征向量,将第n1个单压缩AAC音频的特征向量记为其中,n1为正整数,1≤n1≤N1,和的维数均为M×1024,M表示原始音频中包含的帧的总帧数,表示中下标为(1,1)的QMDCT系数,亦表示第n1个单压缩AAC音频中的第1帧中的第1个采样点的QMDCT系数,表示中下标为(1,1024)的QMDCT系数,亦表示第n1个单压缩AAC音频中的第1帧中的第1024个采样点的QMDCT系数,表示中下标为(M,1)的QMDCT系数,亦表示第n1个单压缩AAC音频中的第M帧中的第1个采样点的QMDCT系数,表示中下标为(M,1024)的QMDCT系数,亦表示第n1个单压缩AAC音频中的第M帧中的第1024个采样点的QMDCT系数,表示中下标为(1,1)的QMDCT系数,亦表示第n1个单压缩AAC音频相应的单压缩移除采样点AAC音频中的第1帧中的第1个采样点的QMDCT系数,表示中下标为(1,1024)的QMDCT系数,亦表示第n1个单压缩AAC音频相应的单压缩移除采样点AAC音频中的第1帧中的第1024个采样点的QMDCT系数,表示中下标为(M,1)的QMDCT系数,亦表示第n1个单压缩AAC音频相应的单压缩移除采样点AAC音频中的第M帧中的第1个采样点的QMDCT系数,表示中下标为(M,1024)的QMDCT系数,亦表示第n1个单压缩AAC音频相应的单压缩移除采样点AAC音频中的第M帧中的第1024个采样点的QMDCT系数,为的下限值,为的上限值,且和的维数为符号“||”为取绝对值符号,表示中的第1个元素的值,表示中的第个元素的值,表示中的第1个元素的值,表示中的第个元素的值;提取每个双压缩AAC音频及其相应的双压缩移除采样点AAC音频各自的QMDCT系数矩阵,将第n2个双压缩AAC音频的QMDCT系数矩阵记为将第n2个双压缩AAC音频相应的双压缩移除采样点AAC音频的QMDCT系数矩阵记为然后获取每个双压缩AAC音频的QMDCT系数矩阵中QMDCT系数的值在范围内的QMDCT系数分布直方图,并获取每个双压缩AAC音频相应的双压缩移除采样点AAC音频的QMDCT系数矩阵中QMDCT系数的值在范围内的QMDCT系数分布直方图,将中QMDCT系数的值在范围内的QMDCT系数分布直方图记为将中QMDCT系数的值在范围内的QMDCT系数分布直方图记为再通过计算每个双压缩AAC音频的QMDCT系数矩阵对应的QMDCT系数分布直方图中的每个元素的值与该双压缩AAC音频相应的双压缩移除采样点AAC音频的QMDCT系数矩阵对应的QMDCT系数分布直方图中的相同位置的元素的值的差值,获取每个双压缩AAC音频的特征向量,将第n2个双压缩AAC音频的特征向量记为其中,n2为正整数,1≤n2≤N2,和的维数均为M×1024,表示中下标为(1,1)的QMDCT系数,亦表示第n2个双压缩AAC音频中的第1帧中的第1个采样点的QMDCT系数,表示中下标为(1,1024)的QMDCT系数,亦表示第n2个双压缩AAC音频中的第1帧中的第1024个采样点的QMDCT系数,表示中下标为(M,1)的QMDCT系数,亦表示第n2个双压缩AAC音频中的第M帧中的第1个采样点的QMDCT系数,表示中下标为(M,1024)的QMDCT系数,亦表示第n2个双压缩AAC音频中的第M帧中的第1024个采样点的QMDCT系数,表示中下标为(1,1)的QMDCT系数,亦表示第n2个双压缩AAC音频相应的双压缩移除采样点AAC音频中的第1帧中的第1个采样点的QMDCT系数,表示中下标为(1,1024)的QMDCT系数,亦表示第n2个双压缩AAC音频相应的双压缩移除采样点AAC音频中的第1帧中的第1024个采样点的QMDCT系数,表示中下标为(M,1)的QMDCT系数,亦表示第n2个双压缩AAC音频相应的双压缩移除采样点AAC音频中的第M帧中的第1个采样点的QMDCT系数,表示中下标为(M,1024)的QMDCT系数,亦表示第n2个双压缩AAC音频相应的双压缩移除采样点AAC音频中的第M帧中的第1024个采样点的QMDCT系数,和的维数为符号“||”为取绝对值符号,表示中的第1个元素的值,表示中的第个元素的值,表示中的第1个元素的值,表示中的第个元素的值;步骤四:从每类所有的单压缩AAC音频中随机选取一部分单压缩AAC音频,并从每类所有的双压缩AAC音频中随机选取一部分双压缩AAC音频;然后将选取的所有单压缩AAC音频和选取的所有双压缩AAC音频构成训练集,将剩余的所有单压缩AAC音频和剩余的所有双压缩AAC音频构成测试集;步骤五:训练Nb个LIBSVM分类器,训练第nb个LIBSVM分类器的具体过程为:将训练集中的第nb类的所有单压缩AAC音频的特征向量,及第二次压缩所采用的比特率与获取对应的第nb类的单压缩AAC音频时所采用的比特率相同的所有双压缩AAC音频的特征向量,输入到LIBSVM分类器中进行训练,得到适用于采用第nb种比特率的AAC音频的训练好的第nb个LIBSVM分类器;其中,nb为正整数,1≤nb≤Nb;步骤六:将测试集中的每个单压缩AAC音频或每个双压缩AAC音频作为待重压缩检测AAC音频;然后根据待重压缩检测AAC音频的公开的比特率,将待重压缩检测AAC音频的特征向量输入到相应的训练好的LIBSVM分类器中,得到用于代表检测结果为单压缩AAC音频的数字标记1或用于代表检测结果为双压缩AAC音频的数字标记0。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宁波大学,未经宁波大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810535084.7/,转载请声明来源钻瓜专利网。