[发明专利]一种基于音频断点的时域数字音频水印方法有效
申请号: | 201510234788.7 | 申请日: | 2015-05-11 |
公开(公告)号: | CN104810022B | 公开(公告)日: | 2018-06-15 |
发明(设计)人: | 王双维;卢宇;郑彩侠;曹晓林;刘天星 | 申请(专利权)人: | 东北师范大学 |
主分类号: | G10L19/018 | 分类号: | G10L19/018 |
代理公司: | 长春市东师专利事务所 22202 | 代理人: | 刘延军;李荣武 |
地址: | 130024 吉*** | 国省代码: | 吉林;22 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种时域下基于音频断点嵌入和提取数字音频水印的方法,依据水印信息的数值和原始音频的能量值直接在原始音频的基础上改变其能量值的大小。只在原始信号的基础之上稍作改动,在不影响原始音频听觉质量的前提条件下,保证水印具有较好的鲁棒性,抗裁剪性和很少的信息增加量。在水印的提取环节,提取算法能够自行筛选出嵌入水印的位置,排除一些在数值逻辑上看似是水印的信息,并具有保存原始水印信息的能力。本发明对水印信息进行了加密处理。所用的水印提取方案只需要一些原始音频的分段信息和水印信号的重构参数,不需要原始音频和原始水印的参与,是一种盲水印算法,可用于音频信号处理和音频制品保护等方面。 1 | ||
搜索关键词: | 原始音频 水印 数字音频水印 水印信息 断点 时域 音频信号处理 原始水印信息 盲水印算法 信息增加量 分段信息 加密处理 前提条件 嵌入水印 水印提取 水印信号 提取算法 原始水印 原始信号 制品保护 鲁棒性 可用 重构 裁剪 听觉 嵌入 筛选 保存 环节 保证 | ||
一、水印的嵌入过程:
(1)水印图像的重新分行:设计一幅h×w的二维点阵水印图像,h和w的值均取64,并进行加密处理,然后,将处理后的水印图像以行为单位平均分成p份,重新分行后的水印每一行就拥有原图像的h/p行的信息,每行像素点数为p_l,p_l=h×w/p;
(2) 音频信号的分段和水印嵌入位置的选取:将音频信号平均t份,每份记为S1,S2,···,St,再将每份音频片段Si,i=1,2,···,t,平均分成p份,每份记为Ri1,Ri2,···,Rip,
然后从每一小份音频Rij,i=1,2,···,t;j=1,2,···,p,中提取出长度为2×p_l的前小段音频信号,记为gij,i=1,2,···,t;j=1,2,···,p;
(3) 水印信息的嵌入及嵌入规则:将每小份音频信号gij平均分成两份h1和h2,长度都为p_l,根据水印信息即二值点阵图像改变这两份信号的能量值,具体规则如下:
I.如果水印信号的一个比特位的值是‘0’,那就保证h1中次序相同的一个比特位的音频信息的能量值稍大于h2中相同次序的一个比特位音频信息,如果不是,将h1中该比特位的音频信息乘以一个放大因子,直到满足条件为止;
II.如果水印信号的一个比特位的值是‘1’,那就保证h2中次序相同的一个比特位的音频信息的能量值稍大于h1中相同次序的一个比特位音频信息,如果不是,将h2中该比特位的音频信息乘以一个放大因子,直到满足条件为止;
III.如果音频信号中某一比特位的能量数值为零,无论怎样乘以放大因子都不能满足条件,此时将其能量值的大小规定为每份音频Rij平均能量值的大小,符号依据每小份音频gij平均值的符号;
(4)水印信息标准化编排:构造一个p×(2×p_l+3×z)×t的三维数组Y,其中,z为音频断点的长度,可取10~20点,将每小份音频信号gij中h1的前面和h2的后面均增添z个零信号,中间再以z个零信号将这两段音频信号拼接成一段逐一存入数组Y中;
(5)含水印的音频信号的重构:将数组Y中的信息和原始音频中未被使用的剩余音频信息按照原音频的时间顺序重新编排在一起拼凑出一段完整的音频;
二、水印的提取过程:
(1) 含水印音频信号的分段并选择出需要检测的片段:将输入的音频信号平均分成t份,记为segi,i=1,2,···,t,提取出每份片段segi从头向后一串长度为3×z+2×p_l的数据串,并且将数据串前后长度为f的小段信息同时选择下来,将每一个选出片段的起止序号作为检测范围存入一个(t×p)×2的二维数组subscript中;
(2) 检索出所有可能存在水印的位置:依据数组subscript中的起止序号,对每小段音频从头至尾进行检测,每一次检测以一串长度为3×z+2×p_l的数据串为单位,凭借嵌入的水印信号前中后这三处位置都有音频断点这一特征,找到所有可能存在水印的位置,并记下这些位置的首地址存入带有分段号的数组position中,具体满足条件如下:
I. 数据串的前中后都有s,10≤s≤z个连续比特位的能量值均小于一定数值scale,根据整个音频的能量或其中某些段的能量来动态取值,或取0.01;
II.该数据串从第z+1个数据往后的p_l个数据的能量平均值和从倒数第z+1个数据往前的p_l个数据的能量平均值都比其中间z个数据的能量平均值大k倍,k值一般根据音乐的情况而定,或5~12;
(3) 从所有可能位置中筛选出最合理的:对所有可能位置前后作差,找到最合理的水印嵌入间隔并反推出所有水印的嵌入位置,具体做法如下:
I.将每个数组position中前后的首地址信息作差,统计这些差值,记录下差值大小在audio_l /(t×p)附近的前后首地址和这些差值的大小,其中audio_l为整首音频的长度;
II.根据统计出的首地址差值的个数选取最终的水印嵌入位置的距离间隔final_inte‑rval,即找出出现次数最多的差值,若有多个,则按其平均值来确定距离间隔;
III.从每份音频segi中找出的可能首地址中再次筛选出最有可能嵌入水印的位置,每份中只需找到一个,并将其置入一个r×p二维数组new_position的相应位置,1≤r ≤t,且r的值根据筛选过程适当确定,然后根据这个数组里的信息和已确定的水印间final_inte‑rval推算出数组中所有其他位置的首地址信息;
(4)水印图像的重构:根据new_position中的首地址提取并重新编排出r幅水印图像,具体的提取规则步骤一中的(3),然后将这r幅图像进行叠加,将这些图像转化成一幅图像;
(5) 水印图像的恢复: 根据事先存储的加密参数对提取出的水印图像做加密的反变换,从而恢复出目标水印图像;
三、利用BP网络的图像修复技术对有损压缩水印图像进行复原。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东北师范大学,未经东北师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510234788.7/,转载请声明来源钻瓜专利网。