[发明专利]基于原始波形的轻量级神经网络生成语音鉴别方法和系统有效
申请号: | 202110866648.7 | 申请日: | 2021-07-29 |
公开(公告)号: | CN113314148B | 公开(公告)日: | 2021-11-09 |
发明(设计)人: | 陶建华;马浩鑫;易江燕 | 申请(专利权)人: | 中国科学院自动化研究所 |
主分类号: | G10L25/30 | 分类号: | G10L25/30;G10L15/16;G10L15/06;G06N3/08;G06N3/04;G06K9/62 |
代理公司: | 北京华夏泰和知识产权代理有限公司 11662 | 代理人: | 李永叶 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 原始 波形 轻量级 神经网络 生成 语音 鉴别方法 系统 | ||
本发明提供基于原始波形的轻量级神经网络生成语音鉴别方法和系统,包括:按固定采样率对音频文件进行采样,得到所述音频文件的原始波形点,再将所述原始波形点切分为原始音频帧,得到原始音频帧序列;第一层为固定的一维卷积层,所述一维卷积层之后为常规模块和降维模块相互堆叠的结构,再之后是平均池化层,所述平均池化层之后为全连接层来构建搜索网络;将所述原始音频帧序列输入搜索网络,分别搜索常规模块和降维模块中每个神经元之间的最优操作连接,得到最优模型结构;应用所述原始音频帧序列训练搜索到的所述最优模型结构,得到训练好的搜索网络。
技术领域
本发明涉及生成语音鉴别领域,具体涉及基于原始波形的轻量级神经网络生成语音鉴别方法和系统。
背景技术
生成语音检测为对输入的语音判检测是否为生成语音,输出证伪二分类检测结果。目前的检测方案主要是基于两方面的改进:更具区分度的声学特征和更有效的分类器,尽管近年来端到端结构的模型不再区分特征提取模块与分类器,且端到端网络在语音识别、语音合成等领域越发成熟,但是在生成语音鉴别领域的主流研究还是采用特征提取与分类器架构。在分类器层面,大部分研究均为选择某种神经网络进行二分类训练,如残差神经网络,轻量级卷积神经网络等,只关注对于语音真伪的判别。
目前已有使用搜索网络搜索方法生成语音检测模型的研究,但是输入该网络的特征为手工设计的LFCC特征,会损失掉音频原有的一些其他特征属性,对未知语音的检测的泛化性不够,网络的检测生成语音的性能并没有明显优于现有的使用已有的神经网络的性能。
从原始音频入手做端到端的生成语音检测的研究又面临着网络的参数量较大,存在较多冗余结构。
公开号为CN110148425A公开了一种基于完整局部二进制模式的伪装语音检测方法,包括:对真实语音库和相应的伪装语音库中所有语音进行变量Q变换,得到所有真实语音和伪装语音的语谱图;分别将各语谱图转换为相应的灰度图像,并采用完整局部二进制模式处理,生成相应的纹理特征;将所有的纹理特征作为训练支持向量机的训练集,训练得到支持向量机;将待识别语音输入至支持向量机,以进行伪装语音的识别。
公开号为CN113077814A公开了一种基于深度密集网络的语音变形检测方法,其特征在于先构建基于卷积神经网络的深度密集学习网络结构,而后使用小批迭代随机梯度下降对所述网络结构的交叉熵误差进行训练,最后将待测语音的时频特征输入到已经训练好的深度密集网络结构中,网络结构中softmax层通过伪装因子来判断待测语音的真伪并识别出伪装语音对应使用的伪装工具,从而输出检测结果。
现有技术缺点
1. 当前检测方案大多基于“特征提取+分类器”框架,特征提取与分类任务是割裂的;
2. 手工设计特征困难,提取到的特征对于未知的生成不一定是最优的;
3. 当前网络存在冗余特征,可以利用网络结构搜索的方法进行剪枝,搜索出一个轻量级的网络模型。
发明内容
有鉴于此,本发明第一方面提供一种基于原始波形的轻量级神经网络生成语音鉴别方法,所述方法包括:
读取输入音频:按固定采样率对音频文件进行采样,得到所述音频文件的原始波形点,再将所述原始波形点切分为原始音频帧,得到原始音频帧序列;
构建搜索网络:网络第一层为固定的一维卷积层特征提取层,所述一维卷积层之后为常规模块和降维模块相互堆叠的结构,再之后是平均池化层,所述平均池化层之后为全连接层;
搜索最优模型结构:将所述原始音频帧序列输入搜索网络,分别搜索常规模块和降维模块中每个神经元节点之间的最优操作连接,得到最优模型结构;
模型训练:应用所述原始音频帧序列训练搜索到的所述最优模型结构,得到训练好的搜索网络;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110866648.7/2.html,转载请声明来源钻瓜专利网。