[发明专利]一种基于一维卷积核的自适应音频复杂度表征方法有效
申请号: | 202010255058.6 | 申请日: | 2020-04-02 |
公开(公告)号: | CN111462765B | 公开(公告)日: | 2023-08-01 |
发明(设计)人: | 王让定;张雪垣;严迪群;林昱臻 | 申请(专利权)人: | 宁波大学 |
主分类号: | G10L19/018 | 分类号: | G10L19/018 |
代理公司: | 宁波诚源专利事务所有限公司 33102 | 代理人: | 袁忠卫;李娜 |
地址: | 315211 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 卷积 自适应 音频 复杂度 表征 方法 | ||
本发明涉及一种基于一维卷积核的自适应音频复杂度表征方法,包括,S1,输入载体x,密信m;S2,根据x、m确定大小为1×n、移动步长为1的一维卷积核k,设定权重参数w,其中w>0;S3,重构音频A’,并求取音频残差D;S4,划定帧长,求取帧内特征参数值δ;S5,求取帧的复杂度C;S6,对采样值进行不同复杂度下、不同二进制位的失真代价ρ统计;S7,输出帧的复杂度C或失真代价ρ。该方法具有计算简便,参数自适应的优点。
技术领域
本发明涉及数字隐写技术领域,尤其涉及一种基于一维卷积核的自适应音频复杂度表征方法。
背景技术
数字隐写作为信息隐藏的重要组成部分,其功能是将秘密信息通过某种方式将其嵌入到数字载体中,使得该载体在公共信道传输而密信不被发现。目前,最安全的隐写方案是内容自适应方案,它们倾向于将秘密信息嵌入具有复杂内容的区域中,而在嵌入密信之前,如何进行复杂度评估,成为了关键技术。目前的主流技术集中在图像领域,在音频领域,少有直接衡量音频复杂度的工具或算法,并且现有的衡量复杂度的算法多来自隐写中的“失真代价函数”,但是该算法计算公式较为复杂。
发明内容
鉴于上述问题,本发明的目的在于提供一种计算简便的基于一维卷积核的自适应音频复杂度表征方法。
为了实现上述目的,本发明的技术方案为:一种基于一维卷积核的自适应音频复杂度表征方法,其特征在于:
S1,输入载体x,密信m;
S2,根据x、m确定大小为1×n、移动步长为1的一维卷积核k,设定权重参数w,其中w>0;
S3,重构音频A’,并求取音频残差D;
S4,划定帧长,求取帧内特征参数值δ;
S5,求取帧的复杂度C;
S6,对采样值进行不同复杂度下、不同二进制位的失真代价ρ统计;
S7,输出帧的复杂度C或失真代价ρ。
进一步的,所述S2中n的值为5,一维卷积核k存在k=[k-2,k-1,k0,k+1,k+2],且
进一步的,所述S3具体包括以下步骤:
S31,对音频进行采样并将每5个采样值作为一个单位A,存在A=[Ai-2,Ai-1,Ai,Ai+1,Ai+2];
S32,对ka进行赋值,具体赋值公式为
其中,ka表示一维卷积核k中第a位的值,它由当前5个采样点的值的权重关系进行构成,表示5个采样值中与目标a位权重对应的采样值,a同时表示该值到中心值Ai的距离;Ai-b表示5个采样值中第i-b个采样值,b=-2,-1,0,1,2;
S32,对中间位置采样点的采样值进行重构,得到Ai'=A·kT,其中T表示失真阈值范围;
S33,求取音频残差D=A-A'。
进一步的,所述S4中帧长为10ms。
进一步的,所述S5中复杂度C求取方式如下:
其中,即为帧内特征参数值δ,T表示失真阈值范围。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宁波大学,未经宁波大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010255058.6/2.html,转载请声明来源钻瓜专利网。