[发明专利]一种基于ArcFace loss算法的跨信道声纹识别方法有效

申请号：	201910495120.6	申请日：	2019-06-10
公开（公告）号：	CN110390937B	公开（公告）日：	2021-12-24
发明（设计）人：	司马华鹏;唐翠翠	申请（专利权）人：	南京硅基智能科技有限公司
主分类号：	G10L17/06	分类号：	G10L17/06;G10L17/02;G10L17/04
代理公司：	江苏舜点律师事务所 32319	代理人：	孙丹
地址：	210012 江苏省***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种基于ArcFace loss算法的跨信道声纹识别方法，解决了跨信道声纹识别率较低的问题，其技术方案要点是将多信道的原始音频预处理后，提取fbank特征、fbank的一阶微分特征和fbank的二阶微分特征，将提取的其中一个信道的特征投入insightvoice网络训练，训练基于ArcFace loss算法的损失函数进行，得到单信道模型。然后将多信道的原始音频特征输入到单信道模型进行fine‑tune，得到多信道模型，使用多信道模型进行跨信道声纹识别，识别错误率低，总体效果较好。
搜索关键词：	一种基于 arcface loss 算法信道声纹识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于ArcFace loss算法的跨信道声纹识别方法，其特征在于，包括：收集说话人至少在两个不同信道的音频，对所述音频进行预处理并提取音频特征；将所述音频特征转换为.lst 文件，所述.lst 文件包括音频路径；将一个信道音频特征的所述.lst 文件投入到insightvoice网络训练单信道模型，所述insightvoice网络通过.lst和音频结合的方式读取音频；将其他信道音频特征的所述.lst 文件输入到所述单信道模型，基于所述单信道模型做fine‑tune得到多信道模型；通过所述多信道模型对不同信道音频进行交叉验证，完成声纹识别；其中，所述insightvoice网络为ResNet‑50网络；所述训练基于ArcFace loss算法的损失函数进行。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于南京硅基智能科技有限公司，未经南京硅基智能科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201910495120.6/，转载请声明来源钻瓜专利网。

上一篇：一种智能音频声纹识别装置及系统
下一篇：基于声纹的语音处理方法、装置和终端设备

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L17-00 讲话者辨认或验证

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于ArcFace loss算法的跨信道声纹识别方法有效

专利文献下载