[发明专利]基于原始波形的轻量级神经网络生成语音鉴别方法和系统有效

专利信息
申请号: 202110866648.7 申请日: 2021-07-29
公开(公告)号: CN113314148B 公开(公告)日: 2021-11-09
发明(设计)人: 陶建华;马浩鑫;易江燕 申请(专利权)人: 中国科学院自动化研究所
主分类号: G10L25/30 分类号: G10L25/30;G10L15/16;G10L15/06;G06N3/08;G06N3/04;G06K9/62
代理公司: 北京华夏泰和知识产权代理有限公司 11662 代理人: 李永叶
地址: 100190 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 原始 波形 轻量级 神经网络 生成 语音 鉴别方法 系统
【权利要求书】:

1.基于原始波形的轻量级神经网络生成语音鉴别方法,其特征在于,所述方法包括:

读取输入音频:按固定采样率对音频文件进行采样,得到所述音频文件的原始波形点,再将所述原始波形点切分为原始音频帧,得到原始音频帧序列;

构建搜索网络:网络第一层为固定的一维卷积层,所述一维卷积层之后为常规模块和降维模块相互堆叠的结构,再之后是平均池化层,所述平均池化层之后为全连接层;

搜索最优模型结构:将所述原始音频帧序列输入搜索网络,分别搜索常规模块和降维模块中每个神经元之间的最优操作连接,得到最优模型结构;

所述最优操作:通过赋予每个操作一个结构权重,每个神经元节点的值等于其前一个神经元节点进行候选操作后的加权和,然后采用两部交叉梯度下降的方法,分别优化网络权重和结构权重的值,训练结束后,选择结构权重值最大的操作作为最优操作;

所述常规模块中包括7个神经元节点,相邻神经元节点中的可供候选操作有6种,具体为:

3*3的深度可分卷积、5*5的深度可分卷积、3*3最大池化、3*3平均池化,直接连接和空操作;

所述降维模块中相邻神经元节点中的可供候选操作有6种,具体为:

3*3的深度可分卷积、5*5的深度可分卷积、3*3最大池化、3*3平均池化,直接连接和空操作;

降维模块与常规模块的不同在于,降维模块输出的特征维度为其输入特征维度的一半,而常规模块输出的特征维度与其输入特征维度保持一致;

搜索常规模块和降维模块中每个神经元节点之间的最优操作连接过程中,对于不同操作的权重系数使用自适应矩估计优化器,对于各个操作的具体参数使用随机梯度下降优化器;

模型训练:应用所述原始音频帧序列训练搜索到的所述最优模型结构,得到训练好的搜索网络;

模型预测:应用读取输入音频方法将测试数据转化为测试音频帧序列,再将所述测试音频帧序列输入到所述训练好的搜索网络,得到真伪二分类结果。

2.根据权利要求1所述的基于原始波形的轻量级神经网络生成语音鉴别方法,其特征在于,所述固定采样率为16000;所述原始音频帧的长度为48000。

3.根据权利要求1所述的基于原始波形的轻量级神经网络生成语音鉴别方法,其特征在于,所述一维卷积层的具体设计包括:一组可训练的有限冲激响应滤波器。

4.根据权利要求3所述的基于原始波形的轻量级神经网络生成语音鉴别方法,其特征在于,所述可训练的有限冲激响应滤波器具体包括:一个带通滤波器,频域表示为:

其中f1f2是可学习的参数,代表带通滤波器的低、高截止频率,f为频域变量;

上式经过逆傅里叶变换,最终得到滤波器g的时域可实现表示:

5.根据权利要求4所述的基于原始波形的轻量级神经网络生成语音鉴别方法,其特征在于,所述可训练的有限冲激响应滤波器还包括:

g[n,f1,f2 ]中额外加入窗函数,得到加窗后的滤波器:

其中,w[n]的为汉明窗,具体形式为:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110866648.7/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top