[发明专利]联邦特征选择方法、装置、计算机设备和存储介质在审
申请号: | 202111004505.1 | 申请日: | 2021-08-30 |
公开(公告)号: | CN113807415A | 公开(公告)日: | 2021-12-17 |
发明(设计)人: | 王春凯;徐健;冯键 | 申请(专利权)人: | 中国再保险(集团)股份有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F21/60;G06N20/00 |
代理公司: | 北京华进京联知识产权代理有限公司 11606 | 代理人: | 孙岩;朱五云 |
地址: | 100032 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 联邦 特征 选择 方法 装置 计算机 设备 存储 介质 | ||
1.一种联邦特征选择方法,其特征在于,所述方法包括:
获取输入的第一样本;
将第一样本ID与本地已存的第二样本ID求交,得到共有ID;
通过预设联邦特征选择策略在所述第一样本和第二样本中获取共有ID样本;
对所述共有ID样本进行特征选择,得到目标数据;
对所述目标数据进行特征迭代优化,直至特征迭代优化结果满足预设数据特征规则,得到联邦特征。
2.根据权利要求1所述的方法,其特征在于,所述通过预设联邦特征选择策略在所述第一样本和第二样本中获取共有ID样本,包括:
根据参与方的个数确定联邦特征选择规则;
根据所述联邦特征选择规则在所述第一样本和第二样本中获取共有ID样本。
3.根据权利要求2所述的方法,其特征在于,所述参与方的数量为至少两个,所述第一样本为基于可公开验证秘密选择规则获取、且采用预设加密算法以及加密参数加密的公开验证加密样本,所述预设加密算法以及所述加密参数由所述参与方共有协议确定;
所述根据参与方的个数确定联邦特征选择规则,根据所述联邦特征选择规则在所述第一样本和第二样本中获取共有ID样本,包括:
若所述参与方的数量为两个,则根据所述可公开验证秘密选择规则从所述公开验证加密样本中获取第一共有ID样本;
从所述第二样本中获取第二共有ID样本;
将所述第一共有ID样本与所述第二共有ID样本进行合并,得到共有ID样本。
4.根据权利要求3所述的方法,其特征在于,所述参与方的数量为至少两个,第一样本为基于可验证密钥分享选择规则以及多项式系数的承诺获取的密钥分享加密样本;
所述方法还包括:
若所述参与方的数量大于两个,则根据所述基于可验证密钥分享选择规则获取密钥分片以及所述多项式系数的承诺;
当根据所述密钥分片以及所述多项式系数的承诺验证多项式等式成立时,将所述密钥分片以及所述多项式系数的承诺发送至联邦协调方;
接收所述联邦协调方发送的共有ID样本;其中,所述共有ID样本是协调方根据所有参与方验证通过的密钥分片以及多项式系数的承诺从所述密钥分享加密样本中确定的。
5.根据权利要求1所述的方法,其特征在于,所述对所述目标数据进行特征迭代优化,直至特征迭代优化结果满足预设数据特征规则,得到联邦特征,包括:
计算所述目标数据的特征值;
将所述特征值与预设数据特征规则进行比较,当所述特征值不满足所述预设数据特征规则,则对所述目标数据进行相关性分析,得到目标相关性特征;
根据所述目标相关性特征对所述目标数据进行特征选择,并计算选择后数据的特征值,直至所述选择后数据的特征值满足所述预设数据特征规则,得到联邦特征。
6.根据权利要求5所述的方法,其特征在于,所述特征值包括证据权重、信息值以及群体稳定性;
所述将所述特征值与预设数据特征规则进行比较,当所述特征值不满足所述预设数据特征规则,则对所述目标数据进行相关性分析,得到目标相关性特征,包括:
将所述证据权重、信息值以及群体稳定性分别与对应的预设数据特征规则进行比较,当所述证据权重、信息值以及群体稳定性中任一不满足所述对应的预设数据特征规则,则对所述目标数据进行相关性分析,得到目标相关性特征。
7.根据权利要求1所述的方法,其特征在于,所述第二样本的确定过程,包括:
获取所述第二样本的原始数据;
对所述原始数据进行预处理,得到预处理后的数据;
对所述预处理后的数据进行相关性分析,得到特征数据;
根据特征数据的特征对所述特征数据进行分箱,得到所述第二样本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国再保险(集团)股份有限公司,未经中国再保险(集团)股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111004505.1/1.html,转载请声明来源钻瓜专利网。