[发明专利]一种拼接语音的检测方法和装置以及设备在审
申请号: | 201911235493.6 | 申请日: | 2019-12-05 |
公开(公告)号: | CN111179912A | 公开(公告)日: | 2020-05-19 |
发明(设计)人: | 陈文敏;李稀敏;肖龙源;蔡振华;刘晓葳 | 申请(专利权)人: | 厦门快商通科技股份有限公司 |
主分类号: | G10L15/04 | 分类号: | G10L15/04;G10L15/06;G10L15/08;G10L25/30 |
代理公司: | 厦门原创专利事务所(普通合伙) 35101 | 代理人: | 高巍 |
地址: | 361000 福建省厦门市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 拼接 语音 检测 方法 装置 以及 设备 | ||
本发明公开了一种拼接语音的检测方法和装置以及设备。其中,所述方法包括:获取用户的正常语音数据,和将该正常语音数据剪切成预设段数,并将该剪切成预设段数的正常语音数据按语音乱序进行拼接得到拼接语音数据,和构建基于该正常语音数据和该拼接语音数据的二分类模型,和采用卷积神经网络对该二分类模型进行拼接语音模型的训练,以及根据该经拼接语音模型训练后的二分类模型,对语音数据进行拼接语音的检测。通过上述方式,能够实现对拼接语音的检测,进而能够保障语音验证的安全性。
技术领域
本发明涉及语音识别技术领域,尤其涉及一种拼接语音的检测方法和装置以及设备。
背景技术
在现实生活的很多场景中,经常需要对用户进行语音验证例如通过语音验证来登录软件程序或通过语音验证来登录终端设备等,但是会有一些不法人员通过将非本人的其他用户的语音进行剪切,进而拼接出特定的音频内容的拼接语音,试图采用该拼接语音来仿冒真实用户的身份来进行语音验证,以此来非法获取利益或者进行一些非法操作等,无法保障语音验证的安全性。
然而,现有技术无法实现对拼接语音的检测,进而无法保障语音验证的安全性。
发明内容
有鉴于此,本发明的目的在于提出一种拼接语音的检测方法和装置以及设备,能够实现对拼接语音的检测,进而能够保障语音验证的安全性。
根据本发明的一个方面,提供一种拼接语音的检测方法,包括:
获取用户的正常语音数据;
将所述正常语音数据剪切成预设段数,并将所述剪切成预设段数的正常语音数据按语音乱序进行拼接得到拼接语音数据;
构建基于所述正常语音数据和所述拼接语音数据的二分类模型;
采用卷积神经网络对所述二分类模型进行拼接语音模型的训练;
根据所述经拼接语音模型训练后的二分类模型,对语音数据进行拼接语音的检测。
其中,所述构建基于所述正常语音数据和所述拼接语音数据的二分类模型,包括:
采用分别提取所述正常语音数据和所述拼接语音数据的短时傅里叶变换特征和一阶短时傅里叶变换特征以及二阶短时傅里叶变换特征,并将所述分别提取的短时傅里叶变换特征和一阶短时傅里叶变换特征以及二阶短时傅里叶变换特征作为卷积神经网络的训练输入的方式,构建基于所述正常语音数据和所述拼接语音数据的二分类模型。
其中,所述采用卷积神经网络对所述二分类模型进行拼接语音模型的训练,包括:
在拼接语音模型中设置随机失活层和局部响应归一化层,和从所述二分类模型中提取出短时傅里叶变换特征,并将所述提取出的短时傅里叶变换特征输入到卷积神经网络,以及采用卷积神经网络对所述二分类模型进行拼接语音模型的训练。
其中,在所述根据所述经拼接语音模型训练后的二分类模型,对语音数据进行拼接语音的检测之后,还包括:
通过交叉熵损失的损失函数和优化算法对采用卷积神经网络进行参数更数,和采用所述经参数更新后的卷积神经网络通过预设次数的迭代对所述二分类模型进行训练更新。
根据本发明的另一个方面,提供一种拼接语音的检测装置,包括:
获取模块、拼接模块、构建模块、训练模块和检测模块;
所述获取模块,用于获取用户的正常语音数据;
所述拼接模块,用于将所述正常语音数据剪切成预设段数,并将所述剪切成预设段数的正常语音数据按语音乱序进行拼接得到拼接语音数据;
所述构建模块,用于构建基于所述正常语音数据和所述拼接语音数据的二分类模型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门快商通科技股份有限公司,未经厦门快商通科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911235493.6/2.html,转载请声明来源钻瓜专利网。