[发明专利]跨信道声纹模型训练方法、识别方法、装置及可读介质在审
申请号: | 202111405114.0 | 申请日: | 2021-11-24 |
公开(公告)号: | CN114171032A | 公开(公告)日: | 2022-03-11 |
发明(设计)人: | 叶林勇;肖龙源;李稀敏;叶志坚 | 申请(专利权)人: | 厦门快商通科技股份有限公司 |
主分类号: | G10L17/04 | 分类号: | G10L17/04;G10L17/02 |
代理公司: | 厦门市首创君合专利事务所有限公司 35204 | 代理人: | 连耀忠 |
地址: | 361000 福建省厦门市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信道 声纹 模型 训练 方法 识别 装置 可读 介质 | ||
1.一种跨信道声纹识别模型训练方法,其特征在于,包括以下步骤:
S1,获取分别从第一信道和第二信道采集到的第一数据集和第二数据集,将所述第一数据集所提取的声学特征作为注册数据集,将所述第二数据集所提取的声学特征作为验证数据集对声纹识别模型进行训练,得到第一声纹识别模型;
S2,在实际应用场景中获取分别从所述第一信道和所述第二信道采集到的第三数据集和第四数据集,将所述第三数据集所提取的声学特征作为注册数据集,将所述第四数据集所提取的声学特征作为验证数据集对所述第一声纹识别模型进行微调,得到第二声纹识别模型;
S3,在实际应用场景中获取分别从所述第一信道和所述第二信道采集到的N1个第五数据集和N2个第六数据集,将所述N1个第五数据集和N2个第六数据集所提取的声学特征输入所述第二声纹识别模型,得到N1个第一声纹特征和N2个第二声纹特征,将所述N1个第一声纹特征和N2个第二声纹特征进行交叉比对并计算其相似度,得到N1*N2个第一相似度分值;
S4,计算所述N1*N2个第一相似度分值的平均值和方差,将所述平均值和方差作为参数固化在所述第二声纹识别模型中,得到第三声纹识别模型。
2.根据权利要求1所述的跨信道声纹识别模型训练方法,其特征在于,所述声纹识别模型采用x-vector或者i-vector框架。
3.根据权利要求1所述的跨信道声纹识别模型训练方法,其特征在于,所述声学特征为经过标准化处理后提取的mfcc特征。
4.根据权利要求3所述的跨信道声纹识别模型训练方法,其特征在于,所述第一数据集、第三数据集和第五数据集的采样率为第一采样率,所述第二数据集、第四数据集和第六数据集的采样率为第二采样率。
5.根据权利要求4所述的跨信道声纹识别模型训练方法,其特征在于,所述标准化处理过程具体包括:
将采样率为第一采样率的数据降采样至采样率为第二采样率的数据;
去除所有数据集的中的静音段,保留有效语音;
对所述有效语音进行加噪处理;
通过语音转码对所有数据集进行数据扩增;
对扩增后的数据集提取mcff特征。
6.一种跨信道声纹识别方法,其特征在于,包括采用权利要求1-5中任一项所述的跨信道声纹识别模型训练方法训练得到的第三声纹识别模型,包括以下步骤:
获取分别从所述第一信道和所述第二信道采集到待识别的第一语音和第二语音;
将所述第一语音和第二语音所对应的声学特征分别输入所述第三声纹识别模型中得到第三声纹特征和第四声纹特征;
计算所述第三声纹特征和第四声纹特征的相似度,得到第二相似度分值,根据所述第二相似度分值结合所述平均值和方差计算得到最终相似度分值,基于所述最终相似度分值确定所述第一语音和第二语音对应的人是否为同一个人。
7.根据权利要求6所述的跨信道声纹识别方法,其特征在于,所述根据所述第二相似度分值结合所述平均值和方差计算得到最终相似度分值,具体包括:
根据以下公式计算所述最终相似度分值:
其中,Smean和σ2为所述N1*N2个第一相似度分值的平均值和方差,Sorigin为所述第二相似度分值,Sfinal为最终相似度分值。
8.根据权利要求6所述的跨信道声纹识别方法,其特征在于,所述基于所述最终相似度分值确定所述第一语音和第二语音对应的人是否为同一个人,具体包括:
判断所述最终相似度分值是否大于或等于设定阈值,若是,则确定所述第一语音和第二语音对应的人是同一个人,否则确定所述第一语音和第二语音对应的人不是同一个人。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门快商通科技股份有限公司,未经厦门快商通科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111405114.0/1.html,转载请声明来源钻瓜专利网。