[发明专利]样本数据生成方法、装置、电子设备及计算机可读介质在审
申请号: | 202110974414.4 | 申请日: | 2021-08-24 |
公开(公告)号: | CN113626848A | 公开(公告)日: | 2021-11-09 |
发明(设计)人: | 袁梓焜;王科;刘博 | 申请(专利权)人: | 北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06F21/60 | 分类号: | G06F21/60;G06F21/62;G06K9/62 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 李阳;赵迪 |
地址: | 100176 北京市北京经济技术*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 样本 数据 生成 方法 装置 电子设备 计算机 可读 介质 | ||
本申请公开了样本数据生成方法、装置、电子设备及计算机可读介质,涉及计算机技术领域,一具体实施方式包括接收样本数据生成请求,进而生成预设字符串,确定所述预设字符串的添加位置;发送所述预设字符串和所述添加位置至各参与方,以使各参与方基于所述预设字符串和所述添加位置对所述各参与方对应的本地数据进行加密,生成加密数据;获取各所述加密数据,进而求交集得到公共加密数据;基于所述公共加密数据,确定公共样本数据,并输出。通过使用信息摘要算法结合为本地数据添加预设字符串的加密方式来解决联邦学习中的隐私求交问题,场景适配性强。
技术领域
本申请涉及计算机技术领域,尤其涉及一种样本数据生成方法、装置、电子设备及计算机可读介质。
背景技术
目前,在联邦模型学习领域,对于训练样本的获取采用隐私求交的方法,但现有的隐私求交方法都有其特定的使用场景,在各参与方的部署条件、通信量及运行时间方面都存在着各自的缺点,很难做到各方面的均衡。
在实现本申请过程中,发明人发现现有技术中至少存在如下问题:
在通过隐私求交获取联邦模型的训练样本时,进行隐私求交的使用场景特定,在进行隐私求交时,各参与方的部署条件、通信量及运行时间各方面很难做到均衡。
发明内容
有鉴于此,本申请实施例提供一种样本数据生成方法、装置、电子设备及计算机可读介质,能够解决现有的在通过隐私求交获取联邦模型的训练样本时,进行隐私求交的使用场景特定,在进行隐私求交时,各参与方的部署条件、通信量及运行时间各方面很难做到均衡的问题。
为实现上述目的,根据本申请实施例的一个方面,提供了一种样本数据生成方法,包括:
接收样本数据生成请求,进而生成预设字符串,确定预设字符串的添加位置;
发送预设字符串和添加位置至各参与方,以使各参与方基于预设字符串和添加位置对各参与方对应的本地数据进行加密,生成加密数据;
获取各加密数据,进而求交集得到公共加密数据;
基于公共加密数据,确定公共样本数据,并输出。
可选地,生成加密数据,包括:
确定添加位置对应的数据标识;
根据数据标识,将预设字符串嵌入各参与方对应的本地数据中,生成各本地嵌入数据;
基于信息摘要算法,对各本地嵌入数据进行处理,以生成散列值,进而将散列值确定为加密数据。
可选地,确定公共样本数据,包括:
在各参与方本地建立本地数据与各加密数据的对应关系;
基于对应关系,定位公共加密数据对应的本地数据,进而将确定出的与公共加密数据对应的本地数据确定为公共样本数据。
可选地,求交集得到公共加密数据,包括:
基于各加密数据,生成异步求交集任务;
执行各异步求交集任务,得到公共加密数据。
可选地,基于各加密数据,生成异步求交集任务,包括:
将各加密数据两两配对,生成配对加密数据;
基于各配对加密数据,生成异步求交集任务。
可选地,执行各异步求交集任务,得到公共加密数据,包括:
执行各异步求交集任务,生成加密交集数据集合;
将加密交集数据集合中的各加密交集数据求交集,进而生成公共加密数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司,未经北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110974414.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种包皮环切器
- 下一篇:一种便携式尿道镜套件
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置