[发明专利]使用生成性模型生成差分隐私数据集在审
申请号: | 202111179400.X | 申请日: | 2021-10-08 |
公开(公告)号: | CN114386470A | 公开(公告)日: | 2022-04-22 |
发明(设计)人: | A·瓦达特;曹天时;A·比耶;K·J·克赖斯;S·菲德勒 | 申请(专利权)人: | 辉达公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F21/62;G06N3/04;G06N3/06;G06N3/08;G06V10/774;G06V10/82 |
代理公司: | 北京市磐华律师事务所 11336 | 代理人: | 高伟 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 使用 生成 模型 隐私 数据 | ||
1.一种方法,包括:
使用机器学习模型生成第一数据集;
计算要应用于所述第一数据集的一组变化,以使得所述第一数据集的一组特征更紧密地匹配第二数据集的相应一组特征;
至少部分地基于噪声信息修改所述一组变化以生成一组修改后的变化,所述噪声信息对应于应用于所述机器学习模型的一个或更多个约束;以及
使用所述修改后的一组变化来更新所述机器学习模型。
2.如权利要求1所述的方法,其中通过至少部分地基于所述第一数据集和所述第二数据集计算Sinkhorn损失来计算所述一组变化。
3.如权利要求2所述的方法,其中计算所述一组变化还包括:至少部分地基于所述Sinkhorn损失和对应于所述第一数据集和所述第二数据集的成本矩阵来计算应用于所述第一数据集中的数据的梯度。
4.如权利要求1所述的方法,其中修改所述一组变化还包括:裁剪所述梯度以减小所述梯度的矢量幅度。
5.如权利要求1所述的方法,其中使用所述修改后的一组变化来更新所述机器学习模型还包括:将函数应用于所述梯度。
6.如权利要求1所述的方法,其中所述噪声信息还包括高斯噪声。
7.如权利要求1所述的方法,其中使用所述机器学习模型来生成所述第一数据集还包括:选择所述第一数据集的类别。
8.如权利要求1所述的方法,其中所述第二数据集还包括隐私数据集的采样。
9.如权利要求8所述的方法,其中所述隐私数据集由数据管理者维护并由隐私屏障保护。
10.如权利要求8所述的方法,其中所述方法还包括:
使所述机器学习模型生成模拟所述隐私数据集的训练数据;以及
提供所述训练数据来训练一个或更多个生成性对抗网络。
11.如权利要求1所述的方法,其中使用所述修改后的一组变化来更新所述机器学习模型还包括:修改所述机器学习模型的一组参数。
12.如权利要求11所述的方法,其中所述一个或更多个约束包括隐私约束,并且其中修改所述机器学习模型的所述一组参数还包括:以至少部分地基于所述隐私约束确定的值来修改梯度。
13.如权利要求1所述的方法,其中所述第一数据集还包括多个图像。
14.如权利要求1所述的方法,其中所述第一数据集还包括对应于所述第一数据集的一个或更多个类别标签。
15.如权利要求1所述的方法,其中至少通过至少部分地基于所述第一数据集和所述第二数据集计算半去偏Sinkhorn损失来计算所述一组变化。
16.一种处理器,包括用于生成机器学习模型的一个或更多个电路,所述机器学习模型至少部分地通过以下步骤训练:
至少部分地基于噪声信息和第一组变化来确定对所述机器学习模型进行的第二组变化,所述第一组变化应用于由所述机器学习模型生成的第一数据集以使所述第一数据集更紧密地匹配第二数据集;以及
至少部分地基于所述第二组变化更新所述机器学习模型,其中所述第二数据集包括从隐私数据集采样的数据。
17.如权利要求16所述的处理器,其中所述第一组变化还包括至少部分地基于所述第一数据集和所述第二数据的样本来计算原始形式最佳传输计划。
18.如权利要求17所述的处理器,其中计算所述原始形式最佳传输计划还包括计算Sinkhorn损失。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于辉达公司,未经辉达公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111179400.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:显示装置
- 下一篇:充电管理装置、充电管理方法以及移动体