[发明专利]一种声纹识别的方法、装置、计算机设备及存储介质在审

专利信息
申请号: 202011359381.4 申请日: 2020-11-27
公开(公告)号: CN112562691A 公开(公告)日: 2021-03-26
发明(设计)人: 陈闽川;马骏;王少军 申请(专利权)人: 平安科技(深圳)有限公司
主分类号: G10L17/02 分类号: G10L17/02;G10L17/04;G10L17/18;G10L17/22
代理公司: 深圳市世联合知识产权代理有限公司 44385 代理人: 汪琳琳
地址: 518000 广东省深圳市福田区福*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 声纹 识别 方法 装置 计算机 设备 存储 介质
【说明书】:

本申请公开了一种声纹识别的方法、装置、计算机设备及存储介质,属于人工智能技术领域,所述方法获取待识别语音并进行分帧处理,得到音频帧集合;对音频帧进行傅里叶变换,得到语音数据的序列信息;将序列信息输入到预先训练好的自注意力声纹识别模型,获取音频帧的声纹特征矩阵;拼接声纹特征矩阵,得到待识别语音的声纹识别结果。此外,本申请还涉及区块链技术,待识别语音可存储于区块链中。本申请通过采用神经网络来进行声纹识别模型的训练与预测,并采用自注意力机制将语音特征映射到隐空间分别进行处理,最后拼接所有音频帧的处理结果得到待识别语音的识别结果,本身可以实现并行操作,在保证识别效率的同时兼顾识别精度。

技术领域

本申请属于人工智能技术领域,具体涉及一种声纹识别的方法、装置、计算机设备及存储介质。

背景技术

声纹识别,属于生物信息识别技术的一种,也被称为说话人识别,是一种通过声音判断说话人身份的技术。由于声纹识别具有安全可靠性,使其可在几乎所有需求进行身份识别的安全性保护领域和个性化应用场合中使用。如在银行、证券、保险等金融机构的业务量持续扩大,产生大量的身份识别需求。与传统身份识别技术相比,声纹识别的优势在于,声纹提取过程简单且成本低、且每个人的声纹特征与其他人的声纹特征不相同,具有唯一性,不易伪造和假冒。由于声纹识别具有安全、可靠、方便等特性,使其在需进行身份识别的场合得到广泛的应用。

目前使用的从端到端的声纹识别大多基于RNN(Recurrent Neural Network,RNN,循环神经网络)或CNN(Cable News Network,卷积神经网络),如百度的Deep Speaker、谷歌的G2G,由于声纹识别需要同时考虑语音中的多个帧来对说话人身份进行判断,传统的RNN递归式神经网络对音频序列进行建模,结构简单,但RNN无法并行实现并行操作,因而识别速度较慢,而且RNN无法很好学习到全局的结构信息,因为其本质是一个马尔科夫决策过程。CNN窗口式遍历功能,方便并行操作,但CNN实际只能获取局部信息,难以获取整段音频的全局结构信息,因此在整段音频的识别上存在精度不高的问题。

发明内容

本申请实施例的目的在于提出一种声纹识别的方法、装置、计算机设备及存储介质,以解决现有的声纹识别方式存在的无法同时兼顾识别效率和识别精度的技术问题。

为了解决上述技术问题,本申请实施例提供一种声纹识别的方法,采用了如下所述的技术方案:

获取待识别语音,并对获取到的待识别语音进行分帧处理,得到待识别语音的音频帧集合,其中,音频帧集合包括若干个音频帧;

提取每一个音频帧中的语音数据,对语音数据进行傅里叶变换,得到语音数据的序列信息;

将序列信息输入到预先训练好的自注意力声纹识别模型进行声纹特征识别,获取每一个音频帧的声纹特征矩阵;

按照矩阵拼接的形式对得到的每一个音频帧的声纹特征矩阵进行拼接,得到待识别语音的声纹识别结果。

进一步地,在将序列信息输入到预先训练好的自注意力声纹识别模型进行声纹特征识别,获取每一个音频帧的声纹特征矩阵的步骤之前,还包括:

在历史语音数据库中获取语音训练数据集,对语音训练数据集进行MFCC特征提取,以获取语音训练数据集的MFCC声学特征;

通过语音训练数据集的MFCC声学特征估算声纹识别模型的模型参数;

搭建自注意力网络函数,并将自注意力网络函数嵌入到预设的通用模型的隐藏层;

将声纹识别模型的模型参数导入到通用模型中,并利用语音训练数据集对通用模型进行训练,得到自注意力声纹识别模型。

进一步地,在将神经网络模型的模型参数导入到通用模型中,并利用语音训练数据集对通用模型进行训练,得到自注意力声纹识别模型的步骤之后,还包括:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011359381.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top