[发明专利]一种模型生成方法、声纹识别方法及对应装置有效
申请号: | 201911123586.X | 申请日: | 2019-11-17 |
公开(公告)号: | CN110838295B | 公开(公告)日: | 2021-11-23 |
发明(设计)人: | 白仲鑫;张晓雷;陈景东 | 申请(专利权)人: | 西北工业大学 |
主分类号: | G10L17/02 | 分类号: | G10L17/02;G10L17/04;G10L17/18;G10L21/0208 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 武成国 |
地址: | 710000 陕西*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 模型 生成 方法 声纹 识别 对应 装置 | ||
1.一种模型生成方法,其特征在于,所述方法包括:
将多个训练样本输入预设的神经网络模型,以计算每一所述训练样本经过所述预设的神经网络模型的输出向量,其中,所述多个训练样本中部分训练样本为相同说话人的声学特征,部分训练样本为不同说话人的声学特征;
根据相同说话人的输出向量计算相同说话人的类内协方差;
根据相同说话人的输出向量计算相同说话人的元素类中心;
根据任意两个不同说话人的元素类中心计算所述任意两个不同说话人的输出向量之间的欧式距离;
根据不同说话人的输出向量之间的欧式距离、相同说话人的类内协方差以及预先构建的损失函数计算对应的训练损失;
根据所述训练损失对所述神经网络模型的各个参数进行迭代更新,以得到声纹特征提取模型。
2.根据权利要求1所述方法,其特征在于,所述预先构建的损失函数f(z|θ)为:
其中,所述r和λ为预设的可调超参数;m′i表示第i个说话人的输出向量的类中心;m′j表示第j个说话人的输出向量的类中心;所述z为神经网络的输出向量;θ为神经网络的待训练参数;K为类别总数;∑i表示第i个说话人的类内协方差;表示正则项。
3.根据权利要求1所述方法,其特征在于,在所述将多个训练样本输入预设的神经网络模型之前,所述方法还包括:
获取语音训练信息,滤除所述语音训练信息中的静音信息和噪声信息,获得多个语音训练片段,并对不同说话人的语音训练片段进行标注;
通过梅尔频率倒谱系数提取每个语音训练片段中的声学特征信息,获得所述多个训练样本。
4.一种声纹识别方法,其特征在于,所述方法包括:
获取待判断用户的实时语音信息,提取所述实时语音信息的声学特征;
将所述实时语音信息的声学特征输入声纹特征提取模型,以提取所述实时语音信息的声纹特征向量,所述声纹特征提取模型采用权利要求1-3中任一项所述的方法获得的声纹特征提取模型;
根据预存用户的语音样本信息的声纹特征向量以及所述实时语音信息的声纹特征向量判断所述待判断用户是否为预存用户。
5.根据权利要求4所述的方法,其特征在于,所述根据预存用户的语音样本信息中的声纹特征向量以及所述实时语音信息中的声纹特征向量判断所述待判断用户是否为预存用户,包括:
将所述预存用户的语音样本信息中的声纹特征向量以及所述实时语音信息中的声纹特征向量输入声纹相似度判断模型,以判断所述待判断用户是否为预存用户;
所述声纹相似度判断模型的建立方法,包括:
获取声学特征训练样本组,所述声学特征训练样本组包括多个训练样本,所述多个训练样本中至少部分训练样本具有不同说话人的声学特征;
将声学特征训练样本组中多个训练样本输入所述声纹特征提取模型,以提取所述声学特征训练样本组中每个训练样本的声纹特征向量;
根据所述声学特征训练样本组中每个训练样本对应的声纹特征向量对声纹相似度判断模型进行训练,获得训练完成的所述声纹相似度判断模型。
6.根据权利要求5所述的方法,其特征在于,在所述获取待判断用户的实时语音信息之前,所述方法还包括:
获取语音样本信息,提取所述语音样本信息的声学特征;
将所述语音样本信息的声学特征输入所述声纹特征提取模型,以提取所述语音样本信息的声纹特征向量;
将所述语音样本信息的声纹特征向量存储在数据库中。
7.根据权利要求4所述的方法,其特征在于,所述提取所述实时语音信息的声学特征,包括:
滤除所述实时语音信息中的静音信息和噪声信息,获得多个实时语音片段;
通过梅尔频率倒谱系数提取每个实时语音片段中的声学特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911123586.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种清理键盘用清灰装置
- 下一篇:一种塑料袋包装盒