[发明专利]合成音频检测方法、系统、移动终端及存储介质有效
申请号: | 202010479131.8 | 申请日: | 2020-05-29 |
公开(公告)号: | CN111798828B | 公开(公告)日: | 2023-02-14 |
发明(设计)人: | 李稀敏;曾志先;叶志坚;肖龙源 | 申请(专利权)人: | 厦门快商通科技股份有限公司 |
主分类号: | G10L13/04 | 分类号: | G10L13/04;G10L13/02 |
代理公司: | 厦门仕诚联合知识产权代理事务所(普通合伙) 35227 | 代理人: | 乐珠秀 |
地址: | 361009 福建省厦门市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 合成 音频 检测 方法 系统 移动 终端 存储 介质 | ||
本发明提供了一种合成音频检测方法、系统、移动终端及存储介质,该方法包括:根据真实音频样本对CNN网络进行训练得到真实化特征转换器;控制真实化特征转换器对训练集数据进行特征转换得到真实化特征,将真实化特征和对应的标签信息输入LCNN网络进行模型训练得到合成音频检测模型;将待检测音频输入真实化特征转换器得到待检测特征;控制合成音频检测模型对待检测特征进行检测得到检测结果。本发明利用真实音频样本的特征学习CNN的模型的设计,以得到真实化特征转换器,该真实化特征转换器能将给定的特征转换为接近真实语音特征的特征,从而增强了训练集数据中真实语音和合成语音之间的区别,提高了合成音频检测模型训练的准确性。
技术领域
本发明属于音频检测技术领域,尤其涉及一种合成音频检测方法、系统、移动终端及存储介质。
背景技术
现代文本生成语音技术和声音转换技术的演进能够生成自然的说话声音,带来的问题就是对说话人识别系统的安全性造成了威胁,这使得在说话人识别系统当中检测非真人的合成音频就变为了一个非常重要的安全问题。
声纹识别技术是实现通过声音来判断说话人身份的技术,主要应用于银行,金融,安防等领域,该技术有成本低,效率高的特点,声纹识别技术的缺陷在于容易遭受录音重放、语音合成、语音生成、语音转换等技术的攻击,导致识别系统将非真实说话人语音判断为说话人语音,攻击者可以通过输入文字到机器然后合成出与说话人相似的语音,从而欺骗识别系统,导致识别系统将机器合成的语音判断为说话人的语音,因此,在声纹识别技术的使用过程中,对待测音频的合成音频检测步骤尤为重要。
现有的合成音频检测方法均需要人工进行声波特征选择后,通过采用声波匹配的方式,以对应进行待测音频的合成判断,即通过基于人工声波特征的选取,以使将待测音频的声波与预设声波进行波纹匹配,以得到合成判断结果,但由于基于人工特征选取的声波匹配方式使得音频检测效率低下,且音频检测精准度差。
发明内容
本发明实施例的目的在于提供一种合成音频检测方法、系统、移动终端及存储介质,旨在解决现有的合成音频检测方法音频检测效率低且音频检测精准度差的问题。
本发明实施例是这样实现的,一种合成音频检测方法,所述方法包括:
获取真实音频样本,并根据所述真实音频样本对CNN网络进行训练,得到真实化特征转换器;
控制所述真实化特征转换器对训练集数据进行特征转换,得到真实化特征,并将所述真实化特征和对应的标签信息输入LCNN网络进行模型训练,得到合成音频检测模型;
将待检测音频输入所述真实化特征转换器,得到待检测特征,并将所述待检测特征输入训练后的所述合成音频检测模型;
控制所述合成音频检测模型对所述待检测特征进行检测,得到检测结果。
更进一步的,所述根据所述真实音频样本对CNN网络进行训练的步骤包括:
采用strided卷积方式控制所述CNN网络中的卷积层对所述真实音频样本进行压缩维度,并采用ReLU激活函数获取卷积结果;
对所述卷积结果进行反卷积,并采用所述ReLU激活函数获取反卷积结果。
更进一步的,所述将所述真实化特征和对应的标签信息输入LCNN网络进行模型训练的步骤之前,所述方法还包括:
根据预设文件长度对所述真实化特征进行特征裁剪,并将长度小于所述预设文件长度的所述真实化特征沿时间轴补0补齐至所述预设文件长度。
更进一步的,所述方法还包括:
当所述LCNN网络中完成最大池化层的池化后,对所述LCNN网络中的特征数据进行批处理归一化。
更进一步的,所述对所述LCNN网络中的特征数据进行批处理归一化的步骤包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门快商通科技股份有限公司,未经厦门快商通科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010479131.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于多色图片的查询结果发送方法、装置和计算机设备
- 下一篇:一种电蚀机