[发明专利]一种基于一维卷积核的自适应音频复杂度表征方法有效
申请号: | 202010255058.6 | 申请日: | 2020-04-02 |
公开(公告)号: | CN111462765B | 公开(公告)日: | 2023-08-01 |
发明(设计)人: | 王让定;张雪垣;严迪群;林昱臻 | 申请(专利权)人: | 宁波大学 |
主分类号: | G10L19/018 | 分类号: | G10L19/018 |
代理公司: | 宁波诚源专利事务所有限公司 33102 | 代理人: | 袁忠卫;李娜 |
地址: | 315211 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 卷积 自适应 音频 复杂度 表征 方法 | ||
1.一种基于一维卷积核的自适应音频复杂度表征方法,其特征在于:
S1,输入载体x,密信m;
S2,根据x、m确定大小为1×n、移动步长为1的一维卷积核k,设定权重参数w,其中w>0;
S3,重构音频A’,并求取音频残差D;
S4,划定帧长,求取帧内特征参数值δ;
S5,求取帧的复杂度C;
复杂度C求取方式如下:
其中,即为帧内特征参数值δ,T表示失真阈值范围;
S6,对采样值进行不同复杂度下、不同二进制位的失真代价ρ统计;
S7,输出帧的复杂度C或失真代价ρ。
2.根据权利要求1所述方法,其特征在于:
所述S2中n的值为5,一维卷积核k存在k=[k-2,k-1,k0,k+1,k+2],且
3.根据权利要求2所述方法,其特征在于:
所述S3具体包括以下步骤:
S31,对音频进行采样并将每5个采样值作为一个单位A,A=[Ai-2,Ai-1,Ai,Ai+1,Ai+2];
S32,对ka进行赋值,具体赋值公式为
其中,ka表示一维卷积核k中第a位的值,它由当前5个采样点的值的权重关系进行构成,表示5个采样值中与目标a位权重对应的采样值,a同时表示该值到中心值Ai的距离;Ai-b表示5个采样值中第i-b个采样值,b=-2,-1,0,1,2;
S32,对中间位置采样点的采样值进行重构,得到Ai’=A·kT,其中T表示失真阈值范围;
S33,求取音频残差D=A-A’。
4.根据权利要求3所述方法,其特征在于:
所述S4中帧长为10ms。
5.根据权利要求1所述方法,其特征在于:
所述S6中失真代价ρ=C×σ,其中σ为复杂度-失真代价转变系数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宁波大学,未经宁波大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010255058.6/1.html,转载请声明来源钻瓜专利网。