[发明专利]声纹识别方法、装置、设备及存储介质有效
申请号: | 202010350084.7 | 申请日: | 2020-04-28 |
公开(公告)号: | CN111524524B | 公开(公告)日: | 2021-10-22 |
发明(设计)人: | 郭跃超;谯轶轩;唐义君;王俊;高鹏;谢国彤 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G10L17/02 | 分类号: | G10L17/02;G10L17/06;G10L17/18;G10L17/20;G10L25/18;G10L25/30 |
代理公司: | 北京市京大律师事务所 11321 | 代理人: | 刘挽澜 |
地址: | 518033 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 声纹 识别 方法 装置 设备 存储 介质 | ||
本发明涉及人工智能领域,公开了声纹识别方法,用于解决在声纹识别过程中识别准确度低下的问题。包括:获取待识别的目标语音信息集合,包括至少一个对象所对应的语音信息;利用预置算法在目标语音信息集合中抽取目标特征信息,并根据第一损失函数优化目标特征信息,得到第一声纹识别结果;获取目标语音信道的目标语音信道信息,目标语音信道信息包括信道噪声信息,目标语音信道用于传输目标语音信息集合;抽取信道噪声信息中的目标特征向量,并根据第二损失函数优化目标特征向量,得到第二声纹识别结果;将第一声纹识别结果与第二声纹识别结果融合,确定最终的声纹识别结果。本发明还涉及区块链技术,所述目标语音信息集合存储于区块链中。
技术领域
本发明涉及人工智能的声纹识别领域,尤其涉及一种声纹识别方法、装置、设备及存储介质。
背景技术
声纹识别是生物识别技术的一种,也称为说话人识别,分为说话对象识别和说话对象辨认。目前常用的声纹识别系统包括传统的基于特征工程的i-vector浅层网络系统和x-vector深度网络系统,以及近年来主流的的端到端d-vector深度网络系统等。这些系统基本上都是通过捕捉说话对象声音的长时特征,将其编码到低维向量表示来有效解决识别问题。具体来说,将说话随想的语音信息通过网络的逐层嵌入最终获得具有固定维度的向量(如512维),然后计算不同说话对象的向量表示间的余弦相似度,进而完成说话对象的辨认和确认等操作。
目前端到端的声纹识别系统,诸如google的GE2E系统,虽然可以完美实现端到端的声纹任务的训练和推理,但是这些系统的损失函数并没有对声音对声音的信道信息中的噪声进行处理,导致深度网络在训练过程中无法感知到信道的相关信息,进而深度网络在训练过后识别到声纹信息的准确度低下。
发明内容
本发明的主要目的在于解决在声纹识别过程中识别准确度低下的问题。
本发明第一方面提供了一种声纹识别方法,包括:获取待识别的目标语音信息集合,所述目标语音信息集合包括至少一个对象所对应的语音信息,所述语音信息是经过预处理过后得到的;利用预置算法在所述目标语音信息集合中抽取目标特征信息,并根据第一损失函数优化所述目标特征信息,得到第一声纹识别结果;获取目标语音信道的目标语音信道信息,所述目标语音信道信息包括信道噪声信息,所述目标语音信道用于传输所述目标语音信息集合;抽取所述信道噪声信息中的目标特征向量,并根据第二损失函数优化所述目标特征向量,得到第二声纹识别结果;将所述第一声纹识别结果与所述第二声纹识别结果融合,确定最终的声纹识别结果。
可选的,在本发明第一方面的第一种实现方式中,所述目标语音信息集合存储于区块链中,所述利用预置算法在所述目标语音信息集合中抽取目标特征信息,并根据第一损失函数优化所述目标特征信息,得到第一声纹识别结果包括:利用预置算法在所述目标语音信息集合中抽取目标特征信息;根据预置公式计算所述目标特征信息的相似度矩阵,得到所述目标特征信息的映射信息;基于所述映射信息与第一损失函数优化所述目标语音信息集合的损失,得到第一声纹识别结果。
可选的,在本发明第一方面的第二种实现方式中,所述利用预置算法在所述目标语音信息集合中抽取目标特征信息包括:利用预置算法采集所述目标语音信息集合中的语音序列,并获取所述语音序列的幅度谱;通过滤波器对所述语音序列的幅度谱进行滤波,得到语音序列的滤波输出结果;对所述语音序列的滤波输出结果进行离散余弦变换,得到目标特征信息。
可选的,在本发明第一方面的第三种实现方式中,所述根据预置公式计算所述目标特征信息的相似度矩阵,得到所述目标特征信息的映射信息包括:将目标特征信息转化为低维向量,所述低维向量为采用低维度表示所述目标特征信息的向量;基于所述低维向量与预置公式计算所述目标特征信息的相似度矩阵,得到所述目标特征信息的映射信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010350084.7/2.html,转载请声明来源钻瓜专利网。