[发明专利]合成音频检测方法、系统、移动终端及存储介质有效
申请号: | 202010479131.8 | 申请日: | 2020-05-29 |
公开(公告)号: | CN111798828B | 公开(公告)日: | 2023-02-14 |
发明(设计)人: | 李稀敏;曾志先;叶志坚;肖龙源 | 申请(专利权)人: | 厦门快商通科技股份有限公司 |
主分类号: | G10L13/04 | 分类号: | G10L13/04;G10L13/02 |
代理公司: | 厦门仕诚联合知识产权代理事务所(普通合伙) 35227 | 代理人: | 乐珠秀 |
地址: | 361009 福建省厦门市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 合成 音频 检测 方法 系统 移动 终端 存储 介质 | ||
1.一种合成音频检测方法,其特征在于,所述方法包括:
获取真实音频样本,并根据所述真实音频样本对CNN网络进行训练,得到真实化特征转换器;
控制所述真实化特征转换器对训练集数据进行特征转换,得到真实化特征,根据预设文件长度对所述真实化特征进行特征裁剪;
将长度小于所述预设文件长度的所述真实化特征沿时间轴补0补齐至所述预设文件长度,并将所述真实化特征和对应的标签信息输入LCNN网络进行模型训练,得到合成音频检测模型;
将待检测音频输入所述真实化特征转换器,得到待检测特征,并将所述待检测特征输入训练后的所述合成音频检测模型;
控制所述合成音频检测模型对所述待检测特征进行检测,得到检测结果;
所述根据所述真实音频样本对CNN网络进行训练的步骤包括:
采用strided卷积方式控制所述CNN网络中的卷积层对所述真实音频样本进行压缩维度,并采用ReLU激活函数获取卷积结果;
对所述卷积结果进行反卷积,并采用所述ReLU激活函数获取反卷积结果;
所述真实化特征为LPS特征,所述LPS特征的静态维数为863,且所述预设文件长度为256帧。
2.如权利要求1所述的合成音频检测方法,其特征在于,所述方法还包括:
当所述LCNN网络中完成最大池化层的池化后,对所述LCNN网络中的特征数据进行批处理归一化。
3.如权利要求2所述的合成音频检测方法,其特征在于,所述对所述LCNN网络中的特征数据进行批处理归一化的步骤包括:
计算所述LCNN网络中每个训练批次训练数据的均值和方差;
根据所述均值和所述方差对应批次的所述训练数据做归一化处理,以得到0-1的分布;
根据所述分布对所述LCNN网络进行尺度变换和偏移。
4.如权利要求1所述的合成音频检测方法,其特征在于,所述LCNN网络采用的激活函数为MFM激活函数。
5.一种合成音频检测系统,其特征在于,所述系统包括:
转换器训练模块,用于获取真实音频样本,并根据所述真实音频样本对CNN网络进行训练,得到真实化特征转换器;
模型训练模块,用于控制所述真实化特征转换器对训练集数据进行特征转换,得到真实化特征,根据预设文件长度对所述真实化特征进行特征裁剪;
将长度小于所述预设文件长度的所述真实化特征沿时间轴补0补齐至所述预设文件长度,并将所述真实化特征和对应的标签信息输入LCNN网络进行模型训练,得到合成音频检测模型;
特征处理模块,用于将待检测音频输入所述真实化特征转换器,得到待检测特征,并将所述待检测特征输入训练后的所述合成音频检测模型;
音频检测模块,用于控制所述合成音频检测模型对所述待检测特征进行检测,得到检测结果;
所述转换器训练模块还用于:采用strided卷积方式控制所述CNN网络中的卷积层对所述真实音频样本进行压缩维度,并采用ReLU激活函数获取卷积结果;
对所述卷积结果进行反卷积,并采用所述ReLU激活函数获取反卷积结果;
所述真实化特征为LPS特征,所述LPS特征的静态维数为863,且所述预设文件长度为256帧。
6.一种移动终端,其特征在于,包括存储设备以及处理器,所述存储设备用于存储计算机程序,所述处理器运行所述计算机程序以使所述移动终端执行根据权利要求1至4任一项所述的合成音频检测方法。
7.一种存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至4任一项所述的合成音频检测方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门快商通科技股份有限公司,未经厦门快商通科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010479131.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:基于多色图片的查询结果发送方法、装置和计算机设备
- 下一篇:一种电蚀机