[发明专利]声纹特征提取方法、装置、电子设备及存储介质在审
申请号: | 202111143893.1 | 申请日: | 2021-09-28 |
公开(公告)号: | CN113889120A | 公开(公告)日: | 2022-01-04 |
发明(设计)人: | 赵情恩 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G10L17/02 | 分类号: | G10L17/02;G10L17/04;G10L25/18;G10L25/24;G10L25/27;G10L25/30 |
代理公司: | 北京市汉坤律师事务所 11602 | 代理人: | 姜浩然;吴丽丽 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 声纹 特征 提取 方法 装置 电子设备 存储 介质 | ||
本公开提供了一种声纹特征提取方法、装置、电子设备及存储介质,涉及人工智能技术领域,尤其涉及语音识别技术。实现方案为:一种声纹特征提取方法包括:获取关于说话人的初始声纹特征数据;基于初始声纹特征数据生成说话人的初始特征向量;生成对应于初始特征向量的协方差矩阵;基于初始特征向量和协方差矩阵,生成说话人的更新的特征向量,其中,更新的特征向量为初始特征向量根据高斯分布的后验均值向量;以及基于更新的特征向量提取说话人的声纹特征。
技术领域
本公开涉及人工智能技术领域,尤其涉及语音识别技术,具体涉及一种声纹特征提取方法、装置、电子设备及存储介质。
背景技术
人工智能是研究使计算机模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,既有硬件层面的技术也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术;人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语言处理技术以及机器学习/深度学习、大数据处理技术、知识图谱技术等几大方向。
在语音识别技术中,声纹特征提取是至关重要的。声纹特征提取一般可以包括用于提取前端特征(也称为低级特征)、用于提取说话人的特征(也称为高级特征)以及用于后端分类的各个模块。语音数据经过上述模块的处理后可以获得相应的识别结果。
然而,在声纹特征提取的过程中,往往会受到说话人自身与环境等多方面因素的干扰,这对声纹特征提取的准确率造成了一定影响。如何消除这些影响从而更准确地提取出说话人的声纹特征,已经成为近年来声纹特征提取技术中的热门研究领域。
在此部分中描述的方法不一定是之前已经设想到或采用的方法。除非另有指明,否则不应假定此部分中描述的任何方法仅因其包括在此部分中就被认为是现有技术。类似地,除非另有指明,否则此部分中提及的问题不应认为在任何现有技术中已被公认。
发明内容
本公开提供了一种声纹特征提取方法、装置、电子设备及存储介质。
根据本公开的一方面,提供了一种声纹特征提取方法,包括:获取关于说话人的初始声纹特征数据;基于初始声纹特征数据生成说话人的初始特征向量;生成对应于初始特征向量的协方差矩阵;基于初始特征向量和协方差矩阵,生成说话人的更新的特征向量,其中,更新的特征向量为初始特征向量根据高斯分布的后验均值向量;以及基于更新的特征向量提取说话人的声纹特征。
根据本公开的另一方面,提供了一种用于训练声纹特征提取模型的方法,包括:提供关于预定说话人的样本初始声纹特征数据;基于样本初始声纹特征数据生成预定说话人的样本初始特征向量;生成对应于样本初始特征向量的样本协方差矩阵;基于样本初始特征向量和样本协方差矩阵,生成预定说话人的更新的样本特征向量,其中,更新的样本特征向量为样本初始特征向量根据高斯分布的后验均值向量;基于更新的样本特征向量提取预定说话人的声纹特征;以及基于声纹特征获取用于更新声纹特征提取模型的网络参数,以训练声纹特征提取模型。
根据本公开的另一方面,提供了一种声纹特征提取装置,包括:获取单元,被配置为获取关于说话人的初始声纹特征数据;第一生成单元,被配置为基于初始声纹特征数据生成说话人的初始特征向量;第二生成单元,被配置为生成对应于初始特征向量的协方差矩阵;第三生成单元,被配置为基于初始特征向量和协方差矩阵,生成说话人的更新的特征向量,其中,更新的特征向量为初始特征向量根据高斯分布的后验均值向量;以及提取单元,被配置为基于更新的特征向量提取说话人的声纹特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111143893.1/2.html,转载请声明来源钻瓜专利网。