[发明专利]一种基于差分隐私的联邦声纹识别方法有效
申请号: | 202010920024.4 | 申请日: | 2020-09-04 |
公开(公告)号: | CN112185395B | 公开(公告)日: | 2021-04-27 |
发明(设计)人: | 廖清;王阳谦;刘洋;蒋琳;王轩 | 申请(专利权)人: | 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) |
主分类号: | G10L17/00 | 分类号: | G10L17/00;G10L17/02;G10L17/04;H04L29/06 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 颜希文;郝传鑫 |
地址: | 518055 广东省深圳市南*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 隐私 联邦 声纹 识别 方法 | ||
1.一种基于差分隐私的联邦声纹识别方法,其特征在于:包括如下步骤:
步骤一:在服务端进行通用背景模型UBM的预训练得到初始通用背景模型UBM,并发送给客户端;
步骤二:客户端接收预训练后的初始通用背景模型UBM,利用本地的私有语音数据进行初始通用背景模型UBM的学习;
步骤三:客户端将步骤二学习得到的统计量进行差分隐私保护,并上传给服务端;
步骤四:服务端聚合多个客户端上传的进行差分隐私保护的统计量,对初始通用背景模型UBM进行更新,得到更新后通用背景模型UBM,并发送给客户端;
步骤五:客户端接收更新后通用背景模型UBM,并借助本地语音数据进行调整得到该客户端用户的高斯混合模型GMM;利用更新后通用背景模型UBM和该用户的高斯混合模型GMM判别待验证语音是否为该客户端用户所产生。
2.根据权利要求1所述的一种基于差分隐私的联邦声纹识别方法,其特征在于:所述步骤一中,初始通用背景模型UBM为能够拟合通用语音特征的通用背景模型UBM,由服务端利用开源的数据集使用EM算法进行预训练得到。
3.根据权利要求1所述的一种基于差分隐私的联邦声纹识别方法,其特征在于:所述步骤二中,初始通用背景模型UBM的学习过程如下:
定义初始通用背景模型UBM表示成λ={wj,μj,σj},j=1,...,M,M为初始通用背景模型UBM中高斯模块的个数,wj,μj和σj分别表示第j个高斯模块在UBM中的权重、均值向量以及协方差矩阵;
计算语音特征X={x1,...,xT}的第t个分量xt在初始通用背景模型UBM的第c个高斯模块上出现的概率:
利用rc,t计算统计量rc和zc:
其中[1]表示元素都为1的向量,T为语音特征X的总长度。
4.根据权利要求3所述的一种基于差分隐私的联邦声纹识别方法,其特征在于:所述步骤三中,客户端对学习得到的统计量进行差分隐私保护的具体方法为:使用Laplace机制的差分隐私,进行扰动添加,添加扰动Y的方式如下:
r′c,t=rc,t+Y (4)
其中,rc,t的全局敏感度s(rc,t)=1;接着利用r′c,t分别计算统计量r′c和z′c,并上传给服务端。
5.根据权利要求4所述的一种基于差分隐私的联邦声纹识别方法,其特征在于:所述步骤四中,对初始通用背景模型UBM进行更新的方法为:利用客户端上传给服务端的统计量r′c和z′c,使用最大后验概率估计MAP对初始通用背景模型UBM进行更新,首先服务端需要将多个客户端上传的统计量r′c和z′c进行聚合:
其中,K表示参与对初始通用背景模型UBM进行更新的客户端数量,然后利用和对初始通用背景模型UBM进行更新,得到更新后通用背景模型UBM,初始通用背景模型UBM表示为UBM0,更新后通用背景模型UBM表示为对第c个高斯模块均值向量的更新过程公式如下:
其中,σ′UBM表示均值向量的先验。
6.根据权利要求5所述的一种基于差分隐私的联邦声纹识别方法,其特征在于:所述步骤五中,对更新后通用背景模型UBM的均值向量进行调整得到高斯混合模型GMM的公式如下:
其中,σ′SPK表示用于更新说话人的高斯混合模型GMM均值向量的先验;客户端可以直接使用高斯混合模型GMM计算似然比来判别待验证语音是否为客户端用户所产生。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院),未经哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010920024.4/1.html,转载请声明来源钻瓜专利网。