[发明专利]黑名单声纹库构建方法、装置、计算机设备和存储介质在审
申请号: | 201910418485.9 | 申请日: | 2019-05-20 |
公开(公告)号: | CN110246503A | 公开(公告)日: | 2019-09-17 |
发明(设计)人: | 马坤;刘微微;赵之砚 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G10L17/18 | 分类号: | G10L17/18;G10L25/27;G10L25/51 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 黄晶晶;黄晓庆 |
地址: | 518033 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音数据 声纹 构建 计算机设备 采样语音 存储介质 声纹识别 声纹特征 神经网络模型 有效性检测 滑动窗口 文本无关 采样 算法 向量 预设 叠加 身份 申请 | ||
1.一种黑名单声纹库构建方法,所述方法包括:
获取黑名单库以及黑名单库中用户的语音数据;
对所述用户的语音数据进行有效性检测,得到所述用户的第一语音数据;
根据预设的滑动窗口对所述第一语音数据进行采样,得到所述用户的多组采样语音数据;
采用叠加算法,将所述用户的多组采样语音数据进行组合,得到第二语音数据,所述第二语音数据用于描述与文本无关的声纹向量;
根据预先训练的深度神经网络模型,提取出所述第二语音数据的声纹特征,所述预先训练的深度神经网络模型是基于样本语音数据训练得到;
根据所述声纹特征构建黑名单声纹库。
2.根据权利要求1所述的方法,其特征在于,所述获取黑名单库以及黑名单库中用户的语音数据包括:
获取历史业务语音数据集合以及黑名单库;
根据所述黑名单库中用户标识,匹配所述历史业务语音数据集合中历史业务语音数据携带的标识;
根据匹配结果,获取与所述用户对应的业务语音数据;
采用语音分割算法,从与所述用户对应的业务语音数据中提取用户的语音数据。
3.根据权利要求1所述的方法,其特征在于,所述对所述用户的语音数据进行有效性检测,得到所述用户的第一语音数据包括:
对所述用户的语音数据进行去噪声处理,得到去噪声后的用户的语音数据;
将去噪声后的用户的语音数据拆分为多帧数据,确定用户的语音数据中各帧数据的能量值;
筛选出能量值大于预设的能量阈值的多帧数据作为所述用户的第一语音数据。
4.根据权利要求1所述的方法,其特征在于,所述根据所述声纹特征,构建黑名单声纹库包括:
获取用户的信息;
建立所述用户的信息以及所述第二语音数据的声纹特征之间的关联关系;
根据所述关联关系,构建黑名单声纹库。
5.根据权利要求1所述的方法,其特征在于,所述根据所述声纹特征,构建黑名单声纹库之后,包括:
当所述黑名单库中加入新的用户时,获取新的用户的信息以及与新的用户对应的目标语音数据;
对所述目标语音数据进行有效性检测、采样以及叠加处理,得到目标样本语音数据;
提取所述目标样本语音数据的声纹特征;
根据所述目标样本语音数据的声纹特征以及所述新的用户的信息,更新黑名单声纹库。
6.根据权利要求1所述的方法,其特征在于,所述根据预先训练的深度神经网络模型,提取出所述第二语音数据的声纹特征之前,包括:
获取所述样本语音数据;
对所述样本语音数据进行有效性检测、采样以及叠加处理,得到语音数据训练样本集合;
将所述语音数据训练样本集合作为训练集进行模型训练,得到深度神经网络模型。
7.一种黑名单声纹库构建装置,其特征在于,所述装置包括:
获取模块,用于获取黑名单库以及黑名单库中用户的语音数据;
检测模块,用于对所述用户的语音数据进行有效性检测,得到所述用户的第一语音数据;
采样模块,用于根据预设的滑动窗口对所述第一语音数据进行采样,得到所述用户的多组采样语音数据;
叠加模块,用于采用叠加算法,将所述用户的多组采样语音数据进行组合,得到第二语音数据,所述第二语音数据用于描述与文本无关的声纹向量;
提取模块,用于根据预先训练的深度神经网络模型,提取出所述第二语音数据的声纹特征,所述预先训练的深度神经网络模型是基于样本语音数据训练得到;
构建模块,用于根据所述声纹特征构建黑名单声纹库。
8.根据权利要求7所述的装置,其特征在于,所述获取模块还用于获取历史业务语音数据集合以及黑名单库,根据所述黑名单库中用户标识,匹配所述历史业务语音数据集合中历史业务语音数据携带的标识,根据匹配结果,获取与所述用户对应的业务语音数据,采用语音分割算法,从与所述用户对应的业务语音数据中提取用户的语音数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910418485.9/1.html,转载请声明来源钻瓜专利网。