[发明专利]一种声纹的识别方法、装置、电子设备及存储介质有效

申请号：	202110359278.8	申请日：	2021-04-02
公开（公告）号：	CN112750441B	公开（公告）日：	2021-07-23
发明（设计）人：	闫士一;王秋明	申请（专利权）人：	北京远鉴信息技术有限公司
主分类号：	G10L17/04	分类号：	G10L17/04;G10L17/08;G10L17/18;G10L25/24
代理公司：	北京超凡宏宇专利代理事务所(特殊普通合伙) 11463	代理人：	刘凤
地址：	100000 北京市海淀区***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种声纹识别方法装置电子设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请提供了一种声纹的识别方法、装置、电子设备及存储介质，识别方法包括：获取的将获取的声学特征信息输入训练好的目标卷积网络中的第一卷积层中，得到时域特征向量和频域特征向量；将时域特征向量和频域特征向量顺次输入训练好的目标卷积网络中的拼接层和第二卷积层中，得到待检测音频对应的目标声纹嵌入向量；根据目标声纹嵌入向量和预设声纹嵌入向量，确定待检测音频是否来自目标对象。本申请在一维卷积基础上，通过对时域信息特征和频域信息特征拼接，并利用新的网络结构进行声纹识别，既保证了快速的声纹识别速度，又提高了声纹识别的实时性能。

技术领域

本申请涉及声音识别技术领域，尤其是涉及一种声纹的识别方法、装置、电子设备及存储介质。

背景技术

声纹属于生理特征的一种，因为每个人的声带结构、发音习惯、居住环境的不同，其声纹几乎是独一无二的。声纹识别技术是一种通过声音判别说话人身份的技术，是把声信号转换成电信号，使用计算机进行识别的过程。

现有技术中，卷积神经网络是目前声纹识别竞赛所采用的常用方法，但是不同维度的卷积网络均存在这不同程度的问题，其中，维度高的卷积网络的计算复杂度高，这样会导致声纹的识别速度差，而维度低的卷积网络的处理速度快，但精度难和准确率难以保证。

发明内容

有鉴于此，本申请的目的在于提供一种声纹的识别方法、装置、电子设备及存储介质，本申请在一维卷积基础上，通过对时域信息特征和频域信息特征拼接，并利用新的网络结构进行声纹识别，既保证了快速的声纹识别速度，又提高了声纹识别的实时性能。

本申请主要包括以下几个方面：

第一方面，本申请实施例提供了一种声纹的识别方法，所述识别方法包括：

从获取的待检测音频中提取出声学特征信息，并将所述声学特征信息输入训练好的目标卷积网络中的第一卷积层中，得到时域特征向量和频域特征向量；

将所述时域特征向量和所述频域特征向量输入训练好的目标卷积网络中的拼接层中，得到拼接特征向量；

将所述拼接特征向量输入训练好的所述目标卷积网络中的第二卷积层中，得到所述待检测音频对应的目标声纹嵌入向量；