[发明专利]基于多种特征融合的语音篡改检测方法有效

申请号：	201910845466.4	申请日：	2019-09-06
公开（公告）号：	CN110853668B	公开（公告）日：	2022-02-01
发明（设计）人：	包永强;梁瑞宇;谢跃;唐闺臣;王青云;朱悦;李明	申请（专利权）人：	南京工程学院
主分类号：	G10L25/03	分类号：	G10L25/03;G10L25/18;G10L25/24;G10L25/30;G10L25/51
代理公司：	南京瑞弘专利商标事务所(普通合伙) 32249	代理人：	徐激波
地址：	211167 江苏***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于多种特征融合语音篡改检测方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于多种特征融合的语音篡改检测方法，检测语音文件是否为拼接而成，其特征在于，包括以下步骤：

步骤S1、将待检测的语音数据进行分帧，划分为多组语音数据帧；

步骤S2、对每组语音数据帧提取多维特征，每帧语音提取67维语音特征，67维语音特征包括如下：

语音特征编号1-11：从语音信号功率频谱图计算的色度图；

语音特征编号12-47：梅尔倒谱系数，一阶梅尔倒谱系数，二阶梅尔倒谱系数；

语音特征编号48-49：过零率，均方根；

语音特征编号50-59：谱图质心，P阶频谱图带宽，频谱图对比度，滚降频率；

语音特征编号60-62：用多项式拟合频谱图得到的多项式系数；

语音特征编号63-64：混沌关联维数，混沌熵；

语音特征编号65-67为：谐波能量特征、基频扰动特征、语音幅度扰动；

步骤S3、构建基于Attention-RNN的模型作为分类器；

步骤S4、将步骤S2中提取到的多维特征输入步骤S3中训练好的分类器中，从而判断当前帧语音是否被篡改。

2.根据权利要求1所述的基于多种特征融合的语音篡改检测方法，其特征在于：所述步骤S3中， Attention-RNN的模型采用两层RNN层，其中第一层是双向RNN层，然后接入一个注意力层，随后是一个全连接Dense层和一个用于减轻过拟合的dropout,最后将输入送到一个dense层，并送入softmax分类器，每个输入先传入bi-RNN，根据各自的状态产生中间状态，通过加权得到输出。

3.根据权利要求1所述的基于多种特征融合的语音篡改检测方法，其特征在于：所述步骤S1中，每组语音数据帧的帧长为512，帧移为256。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于南京工程学院，未经南京工程学院许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201910845466.4/1.html，转载请声明来源钻瓜专利网。

上一篇：基于FPGA的神经网络加速方法和加速器
下一篇：基于改进神经网络的音频篡改识别方法

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于多种特征融合的语音篡改检测方法有效

专利文献下载