[发明专利]一种与时长相关的相同码率mp3双压缩检测方法有效
申请号: | 201610018814.7 | 申请日: | 2016-01-13 |
公开(公告)号: | CN105513600B | 公开(公告)日: | 2019-02-05 |
发明(设计)人: | 王让定;陶表犁;严迪群;金超;周劲蕾 | 申请(专利权)人: | 宁波大学 |
主分类号: | G10L19/008 | 分类号: | G10L19/008;G10L19/18 |
代理公司: | 宁波奥圣专利代理事务所(普通合伙) 33226 | 代理人: | 周珏 |
地址: | 315211 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种与时长相关的相同码率mp3双压缩检测方法,其先获取待检测的mp3语音的时长和压缩码率;然后对待检测的mp3语音进行解码得到wav语音,并提取出QMDCT系数矩阵;接着以相同的压缩码率对解压得到的wav语音进行编码压缩得到mp3语音,并提取出QMDCT系数矩阵;之后获取两个QMDCT系数矩阵的差值矩阵;再将待检测的mp3语音的时长代入一次压缩拟合函数和二次压缩拟合函数中,对应得到一次压缩拟合函数值和二次压缩拟合函数值;最后通过比较差值矩阵中的非零元素的个数的值到一次压缩拟合函数值和二次压缩拟合函数值的距离,确定待检测的mp3语音为一次压缩语音或为二次压缩语音;优点是检测准确率高且检测复杂性低,尤其揭示了检测准确性与语音的时长有关。 | ||
搜索关键词: | 一种 相关 相同 mp3 压缩 检测 方法 | ||
【主权项】:
1.一种与时长相关的相同码率mp3双压缩检测方法,其特征在于包括以下步骤:①获取一个待检测的mp3语音,记为fr;②获取fr的时长和压缩码率,对应记为和br,其中,的单位为秒,br的单位为kbps;所述的步骤②中fr的时长是指fr的语音内容的时间长度;③利用具有编解码功能的mp3编码器对fr进行解码,得到wav语音,同时在解码过程中提取出QMDCT系数矩阵,记为q1;④利用步骤③中的mp3编码器以fr的压缩码率br对步骤③得到的wav语音进行编码压缩,得到mp3语音,同时在编码压缩过程中提取出QMDCT系数矩阵,记为q2;⑤计算q1与q2的差值矩阵,记为D,D=q1‑q2;⑥将fr的时长的值分别代入一次压缩拟合函数Y1(t)=103(A1×t‑B1)和二次压缩拟合函数Y2(t)=103(A2×t‑B2)中,对应得到和然后判断是否成立,如果成立,则确定fr为相同码率下的双压缩语音;否则,确定fr为单压缩语音,其中,Y1(t)为时长变量t的函数,A1表示Y1(t)=103(A1×t‑B1)中的斜率,B1表示Y1(t)=103(A1×t‑B1)中的截距,Y2(t)为时长变量t的函数,A2表示Y2(t)=103(A2×t‑B2)中的斜率,B2表示Y2(t)=103(A2×t‑B2)中的截距,符号“||||0”用于求矩阵中非零元素的个数;所述的步骤⑥中的一次压缩拟合函数Y1(t)=103(A1×t‑B1)和二次压缩拟合函数Y2(t)=103(A2×t‑B2)的获取过程为:⑥_1、选取不同时长的原始的wav语音各N个,其中,N≥50;然后将每个时长的N个原始的wav语音构成一个语音集合;⑥_2、将当前待处理的语音集合定义为当前语音集合;⑥_3、将当前语音集合中当前待处理的第n个原始的wav语音定义为当前wav语音,其中,1≤n≤N,n的初始值为1;⑥_4、利用步骤③中的mp3编码器以fr的压缩码率br对当前wav语音进行编码压缩,得到当前wav语音经一次压缩后形成的mp3语音,同时在编码压缩过程中提取出QMDCT系数矩阵,记为Qn,1;⑥_5、利用步骤③中的mp3编码器对当前wav语音经一次压缩后形成的mp3语音进行解码,得到当前wav语音经一次压缩后形成的mp3语音再经解码形成的wav语音;⑥_6、利用步骤③中的mp3编码器以fr的压缩码率br对当前wav语音经一次压缩后形成的mp3语音再经解码形成的wav语音进行编码压缩,得到当前wav语音经二次压缩后形成的mp3语音,同时在编码压缩过程中提取出QMDCT系数矩阵,记为Qn,2;⑥_7、利用步骤③中的mp3编码器对当前wav语音经二次压缩后形成的mp3语音进行解码,得到当前wav语音经二次压缩后形成的mp3语音再经解码形成的wav语音;⑥_8、利用步骤③中的mp3编码器以fr的压缩码率br对当前wav语音经二次压缩后形成的mp3语音再经解码形成的wav语音进行编码压缩,同时在编码压缩过程中提取出QMDCT系数矩阵,记为Qn,3;⑥_9、令n=n+1,将当前语音集合中下一个待处理的原始的wav语音作为当前wav语音,然后返回步骤⑥_4继续执行,直至当前语音集合中的N个原始的wav语音均处理完毕,其中,n=n+1中的“=”为赋值符号;⑥_10、令Mean1表示一次压缩QMDCT系数均值,并令Mean2表示二次压缩QMDCT系数均值,其中,符号“||||0”用于求矩阵中非零元素的个数;⑥_11、将下一个待处理的语音集合作为当前语音集合,然后返回步骤⑥_3继续执行,直至所有时长各自对应的语音集合处理完毕,得到每个时长对应的一次压缩QMDCT系数均值和二次压缩QMDCT系数均值;⑥_12、对所有时长及所有时长各自对应的一次压缩QMDCT系数均值进行线性拟合,得到一次压缩拟合函数Y1(t)=103(A1×t‑B1);并对所有时长及所有时长各自对应的二次压缩QMDCT系数均值进行线性拟合,得到二次压缩拟合函数Y2(t)=103(A2×t‑B2);其中,Y1(t)为时长变量t的函数,A1表示Y1(t)=103(A1×t‑B1)中的斜率,B1表示Y1(t)=103(A1×t‑B1)中的截距,Y2(t)为时长变量t的函数,A2表示Y2(t)=103(A2×t‑B2)中的斜率,B2表示Y2(t)=103(A2×t‑B2)中的截距。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宁波大学,未经宁波大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610018814.7/,转载请声明来源钻瓜专利网。
- 上一篇:一种基于DSP的低速语音编解码模块
- 下一篇:一种语音控制方法和控制设备