[发明专利]一种声纹特征提取方法、装置、设备及存储介质在审
申请号: | 202111124456.5 | 申请日: | 2021-09-24 |
公开(公告)号: | CN113689863A | 公开(公告)日: | 2021-11-23 |
发明(设计)人: | 吴丽贤;布力;宋才华;林钰杰;关兆雄;杨峰;杜家兵 | 申请(专利权)人: | 广东电网有限责任公司;广东电网有限责任公司佛山供电局 |
主分类号: | G10L17/00 | 分类号: | G10L17/00;G10L17/18;G10L25/24 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 刘思言 |
地址: | 510600 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 声纹 特征 提取 方法 装置 设备 存储 介质 | ||
本申请公开了一种声纹特征提取方法、装置、设备及存储介质,方法包括:获取声纹训练样本的样本静态特征,样本静态特征包括第一静态子特征、第二静态子特征和第三静态子特征;基于差分算法根据样本静态特征获取样本动态特征;根据样本静态特征和样本动态特征对初始差分神经网络进行动态特征提取训练,得到动态特征提取模型;将预置目标静态特征输入动态特征提取模型中进行动态特征提取,得到目标动态特征,目标动态特征维度小于样本动态特征维度。本申请能够解决现有的声纹动静态信息维度较大,产生了较多冗余数据,导致模型优化效率低,且易产生冗余参数技术问题。
技术领域
本申请涉及声纹识别技术领域,尤其涉及一种声纹特征提取方法、装置、设备及存储介质。
背景技术
声纹识别是生物识别技术的一种,也称为说话人识别,包括说话人辨认和说话人确认两种过程。声纹识别就是把声信号转换成电信号,再用计算机进行识别。不同的任务和应用会使用不同的声纹识别技术,如缩小刑侦范围时可能需要辨认技术,而银行交易时则需要确认技术。
现有的声纹识别中会关注到声纹的动静态信息。通常一个信息是静态的,缺乏与其前后时刻对应的信息的协同效应;为了增强相邻时刻信息之间的协同效应,同时需要关注动态特征。然而现有获取的动静态信息维度较大,产生了较多的冗余信息,不利于优化模型的计算效率,且会导致模型产生冗余参数。
发明内容
本申请提供了一种声纹特征提取方法、装置、设备及存储介质,用于解决现有的声纹动静态信息维度较大,产生了较多冗余数据,导致声纹识别模型优化效率低,且易产生冗余参数技术问题。
有鉴于此,本申请第一方面提供了一种声纹特征提取方法,包括:
获取声纹训练样本的样本静态特征,所述样本静态特征包括第一静态子特征、第二静态子特征和第三静态子特征;
基于差分算法根据所述样本静态特征获取样本动态特征;
根据所述样本静态特征和所述样本动态特征对初始差分神经网络进行动态特征提取训练,得到动态特征提取模型;
将预置目标静态特征输入所述动态特征提取模型中进行动态特征提取,得到目标动态特征,所述目标动态特征维度小于所述样本动态特征维度。
优选地,所述基于差分算法根据所述样本静态特征获取样本动态特征,包括:
基于差分算法对所述第一静态子特征和所述第二静态子特征作一阶差分运算,得到一阶差分特征;
基于差分算法对所述第一静态子特征、所述第二静态子特征和所述第三静态子特征作二阶差分运算,得到二阶差分特征;
将所述第一静态子特征、所述一阶差分特征和所述二阶差分特征进行拼接,得到样本动态特征。
优选地,所述根据所述样本静态特征和所述样本动态特征对初始差分神经网络进行动态特征提取训练,得到动态特征提取模型,包括:
将所述样本静态特征输入初始差分神经网络中进行动态特征提取,得到预测动态特征;
根据所述预测动态特征和所述样本动态特征进行均方误差计算,得到度量值;
基于所述度量值对所述初始差分神经网络进行迭代训练,直至所述度量值达到预置训练阈值,得到动态特征提取模型。
优选地,所述将预置目标静态特征输入所述动态特征提取模型中进行动态特征提取,得到目标动态特征,之后还包括:
获取所述目标静态特征和所述目标动态特征对应的声纹标签;
根据所述目标动态特征和所述声纹标签对初始声纹识别模型进行声纹识别训练,得到目标声纹识别模型。
本申请第二方面提供了一种声纹特征提取装置,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东电网有限责任公司;广东电网有限责任公司佛山供电局,未经广东电网有限责任公司;广东电网有限责任公司佛山供电局许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111124456.5/2.html,转载请声明来源钻瓜专利网。