[发明专利]一种多模型融合的声纹识别方法、终端、服务器及存储介质在审
申请号: | 201910441119.5 | 申请日: | 2019-05-24 |
公开(公告)号: | CN110164453A | 公开(公告)日: | 2019-08-23 |
发明(设计)人: | 洪国强;肖龙源;李稀敏;蔡振华;刘晓葳;谭玉坤;王静 | 申请(专利权)人: | 厦门快商通信息咨询有限公司 |
主分类号: | G10L17/04 | 分类号: | G10L17/04;G10L17/20;G10L17/18;G10L17/10;H04L9/32 |
代理公司: | 厦门仕诚联合知识产权代理事务所(普通合伙) 35227 | 代理人: | 乐珠秀 |
地址: | 361000 福建省厦门市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 声纹识别 多模式 融合 存储介质 模型融合 音频数据 频段 服务器 终端 自适应算法 场景 采样频率 环境噪声 模型训练 声纹模型 语音数据 采样率 识别率 声纹 兼容 语音 认证 | ||
1.一种多模型融合的声纹识别方法,其特征在于,包括如下步骤:
(1)建立多模式融合方式进行模型训练,生成多模式融合声纹识别模型,具体如下:
分别对第一至第n采样频率的音频数据进行模型训练,其中n为大于等于1的整数:
第一采样频率的音频数据进行模型训练:将音频数据根据频率从低到高划分为N1个频率段;处于第一频率段的音频数据采用第M1算法进行训练,生成第M11模型;处于第i频率段的音频数据采用第Mi算法模型进行训练,生成第M1i模型;依次类推,处于第N1频率段的音频数据采用第MN1算法进行训练,生成第M1N1模型;其中N1为大于等于1的整数;
第二采样频率的音频数据进行模型训练:将音频数据根据频率从低到高划分为N2个频率段;处于第一频率段的音频数据采用第M1算法进行训练,生成第M21模型;处于第i频率段的音频数据采用第Mi算法进行训练,生成第M2i模型,依次类推,处于第N2频率段的音频数据采用第MN2算法进行训练,生成第M2N2模型;其中N2为大于等于1的整数;
依次类推
第n采样频率的音频数据进行模型训练:将音频数据根据频率从低到高划分为Nn个频率段;处于第一频率段的音频数据采用第M1算法进行训练,生成第Mn1模型;处于第i频率段的音频数据采用第Mi算法进行训练,生成第Mni模型;依次类推,处于第Nn频率段的音频数据采用第MNn算法进行训练,生成第MnNn模型;其中n为大于等于2的整数,Nn为大于等于1的整数;
(2)根据场景需求,选择所述多模式融合声纹识别模型用于进行声纹注册或认证;所述场景需求包含音频数据的采样频率。
2.根据权利要求1所述的多模型融合的声纹识别方法,其特征在于,
所述方法还包含:
所述声纹认证之前,用户注册过程中,根据音频数据的采样频率,确认所应用的多模式融合声纹识别模型,并获取若干模型在不同方式下的注册声纹特征以及相应认证的比较阈值。
3.根据权利要求2所述的多模型融合的声纹识别方法,其特征在于,
判断认证音频数据采样频率是否与注册音频数据采样频率相同,
若认证音频数据采样频率与注册音频数据采样频率相同,则将若干认证声纹特征分别与相应的若干个注册声纹特征进行相似性比较得到若干相似值,根据若干相似值与若干比较阈值确认是否验证成功;
若认证音频数据采样频率与注册音频数据采样频率不相同,则采用注册音频数据采样频率所对应的多模式融合声纹识别模型进行验证,获取若干个认证声纹特征,将若干认证声纹特征分别与相应的若干个注册声纹特征进行相似性比较得到若干相似值,根据若干相似值与若干比较阈值确认是否验证成功。
4.根据权利要求2所述的多模型融合的声纹识别方法,其特征在于,
根据认证音频数据的采样频率,根据注册时的多模式融合声纹识别模型对应的音频数据频率从低到高划分的若干个频率段,分别判断若干个频率段的音频数据进行信噪比检测,若认证音频数据的某一频率段的信噪比小于或小于等于设定的信噪阈值,则多模式融合声纹识别模型剔除该频率段对应的模型进行验证。
5.根据权利要求3所述的多模型融合的声纹识别方法,其特征在于,
根据若干相似值与若干比较阈值确认是否验证成功的方式包含以下的任意一种:
(1)若干相似值均分别大于等于相应的若干比较阈值,则语音数据验证通过;
(2)任意一相似值大于等于相应的比较阈值,则语音数据验证通过;
(3)若干相似值根据加权值大于设定阈值,则语音数据验证通过;
(4)采用神经网络等方式学习融合进行判断是否验证成功。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门快商通信息咨询有限公司,未经厦门快商通信息咨询有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910441119.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:语音识别
- 下一篇:一种基于共振峰偏差的音频同一性判别方法及装置