[发明专利]声纹鉴定方法、模型训练方法、装置、设备及存储介质在审

申请号：	202011481348.9	申请日：	2020-12-14
公开（公告）号：	CN112382300A	公开（公告）日：	2021-02-19
发明（设计）人：	曹岩岗	申请（专利权）人：	北京远鉴信息技术有限公司
主分类号：	G10L17/02	分类号：	G10L17/02;G10L17/06;G10L17/04
代理公司：	北京超凡宏宇专利代理事务所(特殊普通合伙) 11463	代理人：	曹瑞敏
地址：	100000 北京市海淀区***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	声纹鉴定方法模型训练装置设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请提供一种声纹鉴定方法、模型训练方法、装置、设备及存储介质，涉及声纹鉴定技术领域。该方法包括：获取待鉴定语音数据；将待鉴定语音数据和语音数据库中的待匹配语音数据，分别进行特征提取，获取待输入特征，其中，待输入特征包括：多个预设维度的特征；根据待输入特征以及预设声纹鉴定模型，识别获取语音数据库中是否存在与待鉴定语音数据匹配的目标语音。若存在，则确定待鉴定语音数据通过鉴定。相对于现有技术，避免了根据单一特征维度确定目标语音，或根据主观性确定声纹鉴定结果的方式，导致准确性不够高的问题。

技术领域

本申请涉及声纹鉴定技术领域，具体而言，涉及一种声纹鉴定方法、模型训练方法、装置、设备及存储介质。

背景技术

声纹与DNA、指纹等特征一样，是每个人所具有的特征，可以用来鉴别身份，在刑侦、支付、安全、密码等领域有着巨大的潜力。

现有技术中的声纹鉴定，一般首先提取语音的特征，然后通过对比检材语音特征和样本语音特征的相似性，做出同一性判断。现在的声纹鉴定技术主要的理论依据是源-滤波模型(Source-Filter Model)，其中共振峰反映的仅是声道特性，即软腭、舌头、口腔和鼻腔等器官组成的声学通道，共振峰所在频率就是声道的共振频率，除了声道特性，声源特性—基频也进行了考虑，基频反映了在气流的冲击下声带的震动频率。目前声纹鉴定的普遍路线是提取样本和检材语音中的相同音素，然后通过检验音素共振峰和基频的相关属性来进行同一性判定。

但是这种判定方式由于从音素中提取的特征维度比较单一，主观性太强，从而可能导致识别结果不准确的问题。

发明内容

本申请的目的在于，针对上述现有技术中的不足，提供一种声纹鉴定方法、模型训练方法、装置、设备及存储介质，以解决现有技术中根据单一特征维度确定目标语音，或根据主观性确定声纹鉴定结果的方式，导致准确性不够高的问题。

为实现上述目的，本申请实施例采用的技术方案如下：

第一方面，本申请一实施例提供了一种声纹鉴定方法，所述方法包括：

获取待鉴定语音数据；

将所述待鉴定语音数据和语音数据库中的待匹配语音数据，分别进行特征提取，获取待输入特征，其中，所述待输入特征包括：多个预设维度的特征；

根据所述待输入特征以及预设声纹鉴定模型，识别获取所述语音数据库中是否存在与所述待鉴定语音数据匹配的目标语音，其中，所述预设声纹鉴定模型根据样本数据集训练获取，所述样本数据集包括：标注有匹配标识的样本语音，以及各所述样本语音的多个预设维度的特征；

若存在，则确定所述待鉴定语音数据通过鉴定。

可选地，所述样本数据包括：正样本数据和负样本数据；

所述正样本数据包括：同一主体发出的相同样本语音、以及各所述样本语音的预设维度的特征；

所述负样本数据包括：不同主体发出的相同样本语音、以及各所述样本语音的预设维度的特征。