[发明专利]一种多模型融合的声纹识别方法、终端、服务器及存储介质在审
申请号: | 201910441119.5 | 申请日: | 2019-05-24 |
公开(公告)号: | CN110164453A | 公开(公告)日: | 2019-08-23 |
发明(设计)人: | 洪国强;肖龙源;李稀敏;蔡振华;刘晓葳;谭玉坤;王静 | 申请(专利权)人: | 厦门快商通信息咨询有限公司 |
主分类号: | G10L17/04 | 分类号: | G10L17/04;G10L17/20;G10L17/18;G10L17/10;H04L9/32 |
代理公司: | 厦门仕诚联合知识产权代理事务所(普通合伙) 35227 | 代理人: | 乐珠秀 |
地址: | 361000 福建省厦门市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种多模型融合的声纹识别方法、终端、服务器及存储介质,所述方法先建立多模式融合方式进行模型训练,生成多模式融合声纹识别模型,根据场景需求,选择所述多模式融合声纹识别模型用于进行声纹注册或认证;所述场景需求包含音频数据的采样频率。本发明能有效利用不同频段的语音数据特性采用多模式融合的声纹模型进行声纹识别,提升声纹识别的识别率;可以兼容多种采样率,根据精度及语音质量自适应算法。同时将音频数据进行多个频段划分,解决不同环境噪声,提升声纹识别效果。 | ||
搜索关键词: | 声纹识别 多模式 融合 存储介质 模型融合 音频数据 频段 服务器 终端 自适应算法 场景 采样频率 环境噪声 模型训练 声纹模型 语音数据 采样率 识别率 声纹 兼容 语音 认证 | ||
【主权项】:
1.一种多模型融合的声纹识别方法,其特征在于,包括如下步骤:(1)建立多模式融合方式进行模型训练,生成多模式融合声纹识别模型,具体如下:分别对第一至第n采样频率的音频数据进行模型训练,其中n为大于等于1的整数:第一采样频率的音频数据进行模型训练:将音频数据根据频率从低到高划分为N1个频率段;处于第一频率段的音频数据采用第M1算法进行训练,生成第M11模型;处于第i频率段的音频数据采用第Mi算法模型进行训练,生成第M1i模型;依次类推,处于第N1频率段的音频数据采用第MN1算法进行训练,生成第M1N1模型;其中N1为大于等于1的整数;第二采样频率的音频数据进行模型训练:将音频数据根据频率从低到高划分为N2个频率段;处于第一频率段的音频数据采用第M1算法进行训练,生成第M21模型;处于第i频率段的音频数据采用第Mi算法进行训练,生成第M2i模型,依次类推,处于第N2频率段的音频数据采用第MN2算法进行训练,生成第M2N2模型;其中N2为大于等于1的整数;依次类推第n采样频率的音频数据进行模型训练:将音频数据根据频率从低到高划分为Nn个频率段;处于第一频率段的音频数据采用第M1算法进行训练,生成第Mn1模型;处于第i频率段的音频数据采用第Mi算法进行训练,生成第Mni模型;依次类推,处于第Nn频率段的音频数据采用第MNn算法进行训练,生成第MnNn模型;其中n为大于等于2的整数,Nn为大于等于1的整数;(2)根据场景需求,选择所述多模式融合声纹识别模型用于进行声纹注册或认证;所述场景需求包含音频数据的采样频率。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门快商通信息咨询有限公司,未经厦门快商通信息咨询有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910441119.5/,转载请声明来源钻瓜专利网。
- 上一篇:语音识别
- 下一篇:一种基于共振峰偏差的音频同一性判别方法及装置