[发明专利]一种多模型融合的声纹识别方法、终端、服务器及存储介质在审

申请号：	201910441119.5	申请日：	2019-05-24
公开（公告）号：	CN110164453A	公开（公告）日：	2019-08-23
发明（设计）人：	洪国强;肖龙源;李稀敏;蔡振华;刘晓葳;谭玉坤;王静	申请（专利权）人：	厦门快商通信息咨询有限公司
主分类号：	G10L17/04	分类号：	G10L17/04;G10L17/20;G10L17/18;G10L17/10;H04L9/32
代理公司：	厦门仕诚联合知识产权代理事务所(普通合伙) 35227	代理人：	乐珠秀
地址：	361000 福建省厦门市***	国省代码：	福建;35
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种多模型融合的声纹识别方法、终端、服务器及存储介质，所述方法先建立多模式融合方式进行模型训练，生成多模式融合声纹识别模型，根据场景需求，选择所述多模式融合声纹识别模型用于进行声纹注册或认证；所述场景需求包含音频数据的采样频率。本发明能有效利用不同频段的语音数据特性采用多模式融合的声纹模型进行声纹识别，提升声纹识别的识别率；可以兼容多种采样率，根据精度及语音质量自适应算法。同时将音频数据进行多个频段划分，解决不同环境噪声，提升声纹识别效果。
搜索关键词：	声纹识别多模式融合存储介质模型融合音频数据频段服务器终端自适应算法场景采样频率环境噪声模型训练声纹模型语音数据采样率识别率声纹兼容语音认证
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种多模型融合的声纹识别方法，其特征在于，包括如下步骤：(1)建立多模式融合方式进行模型训练，生成多模式融合声纹识别模型，具体如下：分别对第一至第n采样频率的音频数据进行模型训练，其中n为大于等于1的整数：第一采样频率的音频数据进行模型训练：将音频数据根据频率从低到高划分为N1个频率段；处于第一频率段的音频数据采用第M₁算法进行训练，生成第M₁₁模型；处于第i频率段的音频数据采用第M_i算法模型进行训练，生成第M_1i模型；依次类推，处于第N₁频率段的音频数据采用第M_N1算法进行训练，生成第M_1N1模型；其中N₁为大于等于1的整数；第二采样频率的音频数据进行模型训练：将音频数据根据频率从低到高划分为N₂个频率段；处于第一频率段的音频数据采用第M₁算法进行训练，生成第M₂₁模型；处于第i频率段的音频数据采用第M_i算法进行训练，生成第M_2i模型，依次类推，处于第N₂频率段的音频数据采用第M_N2算法进行训练，生成第M_2N2模型；其中N₂为大于等于1的整数；依次类推第n采样频率的音频数据进行模型训练：将音频数据根据频率从低到高划分为N_n个频率段；处于第一频率段的音频数据采用第M₁算法进行训练，生成第M_n1模型；处于第i频率段的音频数据采用第M_i算法进行训练，生成第M_ni模型；依次类推，处于第Nn频率段的音频数据采用第M_Nn算法进行训练，生成第Mn_Nn模型；其中n为大于等于2的整数，Nn为大于等于1的整数；(2)根据场景需求，选择所述多模式融合声纹识别模型用于进行声纹注册或认证；所述场景需求包含音频数据的采样频率。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于厦门快商通信息咨询有限公司，未经厦门快商通信息咨询有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201910441119.5/，转载请声明来源钻瓜专利网。

上一篇：语音识别
下一篇：一种基于共振峰偏差的音频同一性判别方法及装置

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L17-00 讲话者辨认或验证

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种多模型融合的声纹识别方法、终端、服务器及存储介质在审

专利文献下载