[发明专利]声纹识别方法、装置以及电子设备有效
申请号: | 202210232702.7 | 申请日: | 2022-03-10 |
公开(公告)号: | CN114400009B | 公开(公告)日: | 2022-07-12 |
发明(设计)人: | 李亚桐;黎荣晋 | 申请(专利权)人: | 深圳市声扬科技有限公司 |
主分类号: | G10L17/02 | 分类号: | G10L17/02;G10L17/04 |
代理公司: | 深圳市智圈知识产权代理事务所(普通合伙) 44351 | 代理人: | 林炮勤 |
地址: | 518000 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 声纹 识别 方法 装置 以及 电子设备 | ||
本申请实施例公开了一种声纹识别方法、装置以及电子设备。该方法包括:获取待识别语音;通过声纹模型获取待识别语音对应的第一声纹特征;通过识别模型获取第一声纹特征对应的第二声纹特征,其中,识别模型为基于指定训练数据进行训练得到,指定训练数据至少包括基于源域声纹特征以及目标域的声纹特征所得到的自适应声纹特征,其中,目标域与待识别语音所属域相同或相似;将第二声纹特征与预先通过识别模型得到的注册声纹特征进行比对,以进行身份匹配识别。通过上述方式使得,可以基于源域声纹特征以及目标域的声纹特征所得到的的自适应声纹特征对识别模型进行训练,从而可以提高识别模型的准确率。
技术领域
本申请涉及计算机技术领域,更具体地,涉及一种声纹识别方法、装置以及电子设备。
背景技术
随着深度学习技术的发展,声纹识别算法得以大幅度地往前推进。然而由于音频数据的采集场景不同(例如:不同的音频采集设备、不同的语种、不同的生理情况等),导致采集到的音频数据处于不同域内且不同域之间差异较大,从而严重削弱声纹识别系统进行声纹识别的准确性。
发明内容
鉴于上述问题,本申请提出了一种声纹识别方法、装置以及电子设备,以实现改善上述问题。
第一方面,本申请提供了一种声纹识别方法,所述方法包括:获取待识别语音;通过声纹模型获取所述待识别语音对应的第一声纹特征;通过识别模型获取所述第一声纹特征对应的第二声纹特征,其中,所述识别模型为基于指定训练数据进行训练得到,所述指定训练数据至少包括基于源域声纹特征以及目标域的声纹特征所得到的自适应声纹特征,其中,所述目标域与所述待识别语音所属域相同或相似;将所述第二声纹特征与注册声纹特征进行比对,以进行身份匹配识别,其中,所述注册声纹特征为预先通过所述识别模型得到。
第二方面,本申请提供了一种声纹识别装置,所述装置包括:语音获取单元,用于获取待识别语音;第一声纹特征获取单元,用于通过声纹模型获取所述待识别语音对应的第一声纹特征;第二声纹特征获取单元,用于通过识别模型获取所述第一声纹特征对应的第二声纹特征,其中,所述识别模型为基于指定训练数据进行训练得到,所述指定训练数据至少包括基于源域声纹特征以及目标域的声纹特征所得到的自适应声纹特征,其中,所述目标域与所述待识别语音所属域相同或相似;声纹比对单元,用于将所述第二声纹特征与注册声纹特征进行比对,以进行身份匹配识别,其中,所述注册声纹特征为预先通过所述识别模型得到。
第三方面,本申请提供了一种电子设备,包括一个或多个处理器以及存储器;一个或多个程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行, 所述一个或多个程序配置用于执行上述的方法。
第四方面,本申请提供的一种计算机可读存储介质,所述计算机可读存储介质中存储有程序代码,其中,在所述程序代码运行时执行上述的方法。
本申请提供的一种声纹识别方法、装置、电子设备以及存储介质,在获取待识别语音后,通过声纹模型获取所述待识别语音对应的第一声纹特征,通过识别模型获取所述第一声纹特征对应的第二声纹特征,其中,所述识别模型为基于指定训练数据进行训练得到,所述指定训练数据至少包括基于源域声纹特征以及目标域的声纹特征所得到的自适应声纹特征,其中,所述目标域与所述待识别语音所属域相同或相似,将所述第二声纹特征与注册声纹特征进行比对,以进行身份匹配识别,其中,所述注册声纹特征为预先通过所述识别模型得到。通过上述方式使得,可以基于源域声纹特征以及目标域的声纹特征所得到的自适应声纹特征对识别模型进行训练,由于自适应声纹特征所属的域为目标域,与待识别语音所属域相同或相似,从而可以提高识别模型身份匹配识别的准确率。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地 ,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了本申请实施例提出的一种声纹识别方法的流程图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市声扬科技有限公司,未经深圳市声扬科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210232702.7/2.html,转载请声明来源钻瓜专利网。