[发明专利]一种拼接语音的检测方法和装置以及设备在审

申请号：	201911235493.6	申请日：	2019-12-05
公开（公告）号：	CN111179912A	公开（公告）日：	2020-05-19
发明（设计）人：	陈文敏;李稀敏;肖龙源;蔡振华;刘晓葳	申请（专利权）人：	厦门快商通科技股份有限公司
主分类号：	G10L15/04	分类号：	G10L15/04;G10L15/06;G10L15/08;G10L25/30
代理公司：	厦门原创专利事务所(普通合伙) 35101	代理人：	高巍
地址：	361000 福建省厦门市***	国省代码：	福建;35
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种拼接语音检测方法装置以及设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种拼接语音的检测方法和装置以及设备。其中，所述方法包括：获取用户的正常语音数据，和将该正常语音数据剪切成预设段数，并将该剪切成预设段数的正常语音数据按语音乱序进行拼接得到拼接语音数据，和构建基于该正常语音数据和该拼接语音数据的二分类模型，和采用卷积神经网络对该二分类模型进行拼接语音模型的训练，以及根据该经拼接语音模型训练后的二分类模型，对语音数据进行拼接语音的检测。通过上述方式，能够实现对拼接语音的检测，进而能够保障语音验证的安全性。

技术领域

本发明涉及语音识别技术领域，尤其涉及一种拼接语音的检测方法和装置以及设备。

背景技术

在现实生活的很多场景中，经常需要对用户进行语音验证例如通过语音验证来登录软件程序或通过语音验证来登录终端设备等，但是会有一些不法人员通过将非本人的其他用户的语音进行剪切，进而拼接出特定的音频内容的拼接语音，试图采用该拼接语音来仿冒真实用户的身份来进行语音验证，以此来非法获取利益或者进行一些非法操作等，无法保障语音验证的安全性。

然而，现有技术无法实现对拼接语音的检测，进而无法保障语音验证的安全性。

发明内容

有鉴于此，本发明的目的在于提出一种拼接语音的检测方法和装置以及设备，能够实现对拼接语音的检测，进而能够保障语音验证的安全性。

根据本发明的一个方面，提供一种拼接语音的检测方法，包括：

获取用户的正常语音数据；

将所述正常语音数据剪切成预设段数，并将所述剪切成预设段数的正常语音数据按语音乱序进行拼接得到拼接语音数据；

构建基于所述正常语音数据和所述拼接语音数据的二分类模型；

采用卷积神经网络对所述二分类模型进行拼接语音模型的训练；

根据所述经拼接语音模型训练后的二分类模型，对语音数据进行拼接语音的检测。

其中，所述构建基于所述正常语音数据和所述拼接语音数据的二分类模型，包括：

采用分别提取所述正常语音数据和所述拼接语音数据的短时傅里叶变换特征和一阶短时傅里叶变换特征以及二阶短时傅里叶变换特征，并将所述分别提取的短时傅里叶变换特征和一阶短时傅里叶变换特征以及二阶短时傅里叶变换特征作为卷积神经网络的训练输入的方式，构建基于所述正常语音数据和所述拼接语音数据的二分类模型。

其中，所述采用卷积神经网络对所述二分类模型进行拼接语音模型的训练，包括：