[发明专利]基于QMDCT系数的AAC音频重压缩检测方法有效

申请号：	201810535084.7	申请日：	2018-05-30
公开（公告）号：	CN108877816B	公开（公告）日：	2022-12-27
发明（设计）人：	王让定;黄其娟;严迪群;张坚	申请（专利权）人：	宁波大学
主分类号：	G10L19/008	分类号：	G10L19/008;G10L25/51
代理公司：	宁波奥圣专利代理有限公司 33226	代理人：	周珏
地址：	315211 浙***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种基于QMDCT系数的AAC音频重压缩检测方法，其获得不同比特率的单压缩AAC音频和双压缩AAC音频；通过移除采样点获得单压缩移除采样点AAC音频和双压缩移除采样点AAC音频；根据单压缩AAC音频和对应的单压缩移除采样点AAC音频各自的QMDCT系数分布直方图，得到相应的特征向量；并根据双压缩AAC音频和对应的双压缩移除采样点AAC音频各自的QMDCT系数分布直方图，得到相应的特征向量；根据同比特率的单压缩AAC音频和双压缩AAC音频的特征向量，训练LIBSVM分类器；测试时根据待重压缩检测AAC音频的比特率输入到相应的训练好的LIBSVM分类器中得到检测结果；优点是能实现低码率转高码率重压缩及同码率重压缩的AAC音频的有效检测，且检测准确率高、计算复杂度较低，鲁棒性较强。
搜索关键词：	基于 qmdct 系数 aac 音频压缩检测方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于QMDCT系数的AAC音频重压缩检测方法，其特征在于包括以下步骤：步骤一：随机选取N_o个时长一致而风格不同的原始音频，原始音频的格式为WAV格式；然后使用AAC编码器并采用N_b种比特率，分别对每个原始音频进行压缩，得到N_b类具有不同比特率的共N₁个单压缩AAC音频；接着使用AAC解码器，对每个单压缩AAC音频进行解压，得到每个单压缩AAC音频对应的解压音频，解压音频的格式为WAV格式；再使用相同的AAC编码器并采用N_b种比特率中大于或等于获取对应的单压缩AAC音频时所采用的比特率的所有比特率，分别对每个单压缩AAC音频对应的解压音频进行压缩，得到类共N₂个双压缩AAC音频；其中，N_o≥100，原始音频的时长为大于或等于1秒，N_b≥1，N₁＝N_o×N_b，步骤二：使用与步骤一中相同的AAC解码器对每个单压缩AAC音频进行解压，得到每个单压缩AAC音频对应的WAV音频；然后针对每个单压缩AAC音频对应的WAV音频，从其起始位置开始移除Nremove个采样点，得到每个单压缩AAC音频对应的移除采样点后的WAV音频；再使用与步骤一中相同的AAC编码器并采用获取对应的单压缩AAC音频时所采用的比特率，对每个单压缩AAC音频对应的移除采样点后的WAV音频进行压缩，得到每个单压缩AAC音频相应的单压缩移除采样点AAC音频；其中，1≤Nremove＜1024；使用与步骤一中相同的AAC解码器对每个双压缩AAC音频进行解压，得到每个双压缩AAC音频对应的WAV音频；然后针对每个双压缩AAC音频对应的WAV音频，从其起始位置开始移除Nremove个采样点，得到每个双压缩AAC音频对应的移除采样点后的WAV音频；再使用与步骤一中相同的AAC编码器并采用获取对应的双压缩AAC音频时第二次压缩所采用的比特率，对每个双压缩AAC音频对应的移除采样点后的WAV音频进行压缩，得到每个双压缩AAC音频相应的双压缩移除采样点AAC音频；步骤三：提取每个单压缩AAC音频及其相应的单压缩移除采样点AAC音频各自的QMDCT系数矩阵，将第n₁个单压缩AAC音频的QMDCT系数矩阵记为将第n₁个单压缩AAC音频相应的单压缩移除采样点AAC音频的QMDCT系数矩阵记为然后获取每个单压缩AAC音频的QMDCT系数矩阵中QMDCT系数的值在范围内的QMDCT系数分布直方图，并获取每个单压缩AAC音频相应的单压缩移除采样点AAC音频的QMDCT系数矩阵中QMDCT系数的值在范围内的QMDCT系数分布直方图，将中QMDCT系数的值在范围内的QMDCT系数分布直方图记为将中QMDCT系数的值在范围内的QMDCT系数分布直方图记为再通过计算每个单压缩AAC音频的QMDCT系数矩阵对应的QMDCT系数分布直方图中的每个元素的值与该单压缩AAC音频相应的单压缩移除采样点AAC音频的QMDCT系数矩阵对应的QMDCT系数分布直方图中的相同位置的元素的值的差值，获取每个单压缩AAC音频的特征向量，将第n₁个单压缩AAC音频的特征向量记为其中，n₁为正整数，1≤n₁≤N₁，和的维数均为M×1024，M表示原始音频中包含的帧的总帧数，表示中下标为(1,1)的QMDCT系数，亦表示第n₁个单压缩AAC音频中的第1帧中的第1个采样点的QMDCT系数，表示中下标为(1,1024)的QMDCT系数，亦表示第n₁个单压缩AAC音频中的第1帧中的第1024个采样点的QMDCT系数，表示中下标为(M,1)的QMDCT系数，亦表示第n₁个单压缩AAC音频中的第M帧中的第1个采样点的QMDCT系数，表示中下标为(M,1024)的QMDCT系数，亦表示第n₁个单压缩AAC音频中的第M帧中的第1024个采样点的QMDCT系数，表示中下标为(1,1)的QMDCT系数，亦表示第n₁个单压缩AAC音频相应的单压缩移除采样点AAC音频中的第1帧中的第1个采样点的QMDCT系数，表示中下标为(1,1024)的QMDCT系数，亦表示第n₁个单压缩AAC音频相应的单压缩移除采样点AAC音频中的第1帧中的第1024个采样点的QMDCT系数，表示中下标为(M,1)的QMDCT系数，亦表示第n₁个单压缩AAC音频相应的单压缩移除采样点AAC音频中的第M帧中的第1个采样点的QMDCT系数，表示中下标为(M,1024)的QMDCT系数，亦表示第n₁个单压缩AAC音频相应的单压缩移除采样点AAC音频中的第M帧中的第1024个采样点的QMDCT系数，为的下限值，为的上限值，且和的维数为符号“||”为取绝对值符号，表示中的第1个元素的值，表示中的第个元素的值，表示中的第1个元素的值，表示中的第个元素的值；提取每个双压缩AAC音频及其相应的双压缩移除采样点AAC音频各自的QMDCT系数矩阵，将第n₂个双压缩AAC音频的QMDCT系数矩阵记为将第n₂个双压缩AAC音频相应的双压缩移除采样点AAC音频的QMDCT系数矩阵记为然后获取每个双压缩AAC音频的QMDCT系数矩阵中QMDCT系数的值在范围内的QMDCT系数分布直方图，并获取每个双压缩AAC音频相应的双压缩移除采样点AAC音频的QMDCT系数矩阵中QMDCT系数的值在范围内的QMDCT系数分布直方图，将中QMDCT系数的值在范围内的QMDCT系数分布直方图记为将中QMDCT系数的值在范围内的QMDCT系数分布直方图记为再通过计算每个双压缩AAC音频的QMDCT系数矩阵对应的QMDCT系数分布直方图中的每个元素的值与该双压缩AAC音频相应的双压缩移除采样点AAC音频的QMDCT系数矩阵对应的QMDCT系数分布直方图中的相同位置的元素的值的差值，获取每个双压缩AAC音频的特征向量，将第n₂个双压缩AAC音频的特征向量记为其中，n₂为正整数，1≤n₂≤N₂，和的维数均为M×1024，表示中下标为(1,1)的QMDCT系数，亦表示第n₂个双压缩AAC音频中的第1帧中的第1个采样点的QMDCT系数，表示中下标为(1,1024)的QMDCT系数，亦表示第n₂个双压缩AAC音频中的第1帧中的第1024个采样点的QMDCT系数，表示中下标为(M,1)的QMDCT系数，亦表示第n₂个双压缩AAC音频中的第M帧中的第1个采样点的QMDCT系数，表示中下标为(M,1024)的QMDCT系数，亦表示第n₂个双压缩AAC音频中的第M帧中的第1024个采样点的QMDCT系数，表示中下标为(1,1)的QMDCT系数，亦表示第n₂个双压缩AAC音频相应的双压缩移除采样点AAC音频中的第1帧中的第1个采样点的QMDCT系数，表示中下标为(1,1024)的QMDCT系数，亦表示第n₂个双压缩AAC音频相应的双压缩移除采样点AAC音频中的第1帧中的第1024个采样点的QMDCT系数，表示中下标为(M,1)的QMDCT系数，亦表示第n₂个双压缩AAC音频相应的双压缩移除采样点AAC音频中的第M帧中的第1个采样点的QMDCT系数，表示中下标为(M,1024)的QMDCT系数，亦表示第n₂个双压缩AAC音频相应的双压缩移除采样点AAC音频中的第M帧中的第1024个采样点的QMDCT系数，和的维数为符号“||”为取绝对值符号，表示中的第1个元素的值，表示中的第个元素的值，表示中的第1个元素的值，表示中的第个元素的值；步骤四：从每类所有的单压缩AAC音频中随机选取一部分单压缩AAC音频，并从每类所有的双压缩AAC音频中随机选取一部分双压缩AAC音频；然后将选取的所有单压缩AAC音频和选取的所有双压缩AAC音频构成训练集，将剩余的所有单压缩AAC音频和剩余的所有双压缩AAC音频构成测试集；步骤五：训练Nb个LIBSVM分类器，训练第nb个LIBSVM分类器的具体过程为：将训练集中的第nb类的所有单压缩AAC音频的特征向量，及第二次压缩所采用的比特率与获取对应的第nb类的单压缩AAC音频时所采用的比特率相同的所有双压缩AAC音频的特征向量，输入到LIBSVM分类器中进行训练，得到适用于采用第nb种比特率的AAC音频的训练好的第nb个LIBSVM分类器；其中，nb为正整数，1≤nb≤Nb；步骤六：将测试集中的每个单压缩AAC音频或每个双压缩AAC音频作为待重压缩检测AAC音频；然后根据待重压缩检测AAC音频的公开的比特率，将待重压缩检测AAC音频的特征向量输入到相应的训练好的LIBSVM分类器中，得到用于代表检测结果为单压缩AAC音频的数字标记1或用于代表检测结果为双压缩AAC音频的数字标记0。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于宁波大学，未经宁波大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201810535084.7/，转载请声明来源钻瓜专利网。

上一篇：一种立体声信号处理方法及装置
下一篇：一种音频采集装置和基于此装置的全景声的编码方案

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L19-00 用于冗余度下降情形
G10L19-02 .利用频谱分析，例如变换声码器或子频带声码器
G10L19-04 .利用预测技术
G10L19-06 ..例如短期预测系数的频谱特征的确定或编码
G10L19-08 ..激励函数的确定或编码；长期预测参数的确定或编码
G10L19-14 ..不包括在G10L 19/06至G10L 19/12组中的零部件，例如增益编码、后置滤波设计或声码器结构

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于QMDCT系数的AAC音频重压缩检测方法有效

专利文献下载