[发明专利]一种声纹识别方法、装置、存储介质、服务器及系统有效
申请号: | 201911360737.3 | 申请日: | 2019-12-25 |
公开(公告)号: | CN111128198B | 公开(公告)日: | 2022-10-28 |
发明(设计)人: | 叶林勇;肖龙源;李稀敏;蔡振华;刘晓葳 | 申请(专利权)人: | 厦门快商通科技股份有限公司 |
主分类号: | G10L17/00 | 分类号: | G10L17/00;G10L17/02;G10L17/04;G10L21/0208 |
代理公司: | 厦门仕诚联合知识产权代理事务所(普通合伙) 35227 | 代理人: | 乐珠秀 |
地址: | 361009 福建省厦门市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 声纹 识别 方法 装置 存储 介质 服务器 系统 | ||
1.一种声纹识别方法,其特征在于,所述方法包括:
接收交换机通过MRCP协议发送的声纹识别请求,所述声纹识别请求当中包含待识别的原始语音数据;
利用预设语音去噪算法对所述原始语音数据进行去噪处理;
所述利用预设语音去噪算法对所述原始语音数据进行去噪处理的步骤包括:
利用改进的LMS自适应滤波算法去除所述原始语音数据当中的环境噪声;其中,所述改进的LMS自适应滤波算法包括:
J=min||wTx-βd||2+α
利用梯度下降:
1)给定W(0),且1<μ<1/λmax;
2)计算输出的值:y(k)=w(k)Tx(k);
3)计算估计误差:e(k)=βd(k)-y(k);
4)权重更新:w(k+1)=w(k)+μe(k)x(k),β(k+1)=β(k)+μe(k)d(k),α(k+1)=β(k)*α(k);
提取去噪后的语音数据当中的声学特征,并将所述声学特征输入到训练好的声纹识别模型当中,得到目标声学特征值;
将所述目标声学特征值在预设声纹数据库当中进行匹配,当存在匹配率高于阈值的匹配结果时,判定声纹识别成功。
2.如权利要求1所述的声纹识别方法,其特征在于,所述将所述目标声学特征值在预设声纹数据库当中进行匹配的步骤包括:
根据预设匹配算法,将所述目标声学特征值与所述预设声纹数据库当中的每一预设声学特征值进行匹配打分;
从所有打分值当中提取最高打分值;
判断所述最高打分值是否大于所述阈值;
若是,则判定存在所述匹配率高于阈值的匹配结果。
3.如权利要求2所述的声纹识别方法,其特征在于,所述预设匹配算法为欧拉距离公式。
4.如权利要求1所述的声纹识别方法,其特征在于,在所述判定声纹识别成功的步骤之后,还包括:
通过所述MRCP协议向所述交换机反馈声纹识别结果。
5.如权利要求1所述的声纹识别方法,其特征在于,所述提取去噪后的语音数据当中的声学特征的步骤包括:
利用MFCC算法提取所述去噪后的语音数据当中的声学特征;
其中,所述目标声学特征值和预设声学特征值均为256维的一阶向量。
6.一种声纹识别装置,其特征在于,所述装置包括:
请求接收模块,用于接收交换机通过MRCP协议发送的声纹识别请求,所述声纹识别请求当中包含待识别的原始语音数据;
语音去噪模块,用于利用预设语音去噪算法对所述原始语音数据进行去噪处理;包括:
利用改进的LMS自适应滤波算法去除所述原始语音数据当中的环境噪声;其中,所述改进的LMS自适应滤波算法包括:
J=min||wTx-βd||2+α
利用梯度下降:
1)给定W(0),且1<μ<1/λmax;
2)计算输出的值:y(k)=w(k)Tx(k);
3)计算估计误差:e(k)=βd(k)-y(k);
4)权重更新:w(k+1)=w(k)+μe(k)x(k),β(k+1)=β(k)+μe(k)d(k),α(k+1)=β(k)*α(k);
特征提取模块,用于提取去噪后的语音数据当中的声学特征,并将所述声学特征输入到训练好的声纹识别模型当中,得到目标声学特征值;
声纹识别模块,用于将所述目标声学特征值在预设声纹数据库当中进行匹配,当存在匹配率高于阈值的匹配结果时,判定声纹识别成功。
7.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-5任一所述的声纹识别方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门快商通科技股份有限公司,未经厦门快商通科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911360737.3/1.html,转载请声明来源钻瓜专利网。