[发明专利]一种基于三方纵向联邦的LOF异常检测方法及系统有效
申请号: | 202210000395.X | 申请日: | 2022-01-04 |
公开(公告)号: | CN114003944B | 公开(公告)日: | 2022-03-25 |
发明(设计)人: | 刘凯;郭浩亮;张韶峰 | 申请(专利权)人: | 百融至信(北京)征信有限公司 |
主分类号: | G06F21/60 | 分类号: | G06F21/60;G06F21/62;G06N20/00;G06Q20/40 |
代理公司: | 北京鼎佳达知识产权代理事务所(普通合伙) 11348 | 代理人: | 刘铁生;孟阿妮 |
地址: | 100000 北京市朝阳*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 纵向 联邦 lof 异常 检测 方法 系统 | ||
1.一种基于三方纵向联邦的LOF异常检测方法,其中,所述方法包括:
对第一数据方和第二数据方的样本ID进行求交运算,获得所述第一数据方和所述第二数据方的交集样本ID;
获得所述第一数据方的各个样本数据在所述第一数据方特征下的第一距离数据集,所述第一距离数据集是指所述第一数据方的各个样本数据在所述第一数据方特征下的距离平方组成的集合;
获得所述第二数据方的各个样本数据在所述第二数据方特征下的第二距离数据集,所述第二距离数据集是指所述第二数据方的各个样本数据在所述第二数据方特征下的距离平方组成的集合;
对所述第一距离数据集和所述第二距离数据集进行拆分,获得第一数据碎片和第二数据碎片后,将所述第一数据碎片和所述第二数据碎片进行数据交换并进行加和,获得第一样本集合和第二样本集合;
获得第一预定Hash方法;
所述第一数据方和所述第二数据方根据所述第一预定Hash方法,对所述第一样本集合和所述第二样本集合进行Hash映射,获得第三样本集合和第四样本集合;
将所述第三样本集合和所述第四样本集合发送给协调计算方,所述协调计算方对所述第三样本集合和所述第四样本集合进行加和,获得第五样本集合;
根据所述第五样本集合,计算获得LOF参数信息;
根据所述LOF参数信息,获得LOF异常得分,所述LOF即局部异常因子算法,是指在数据挖掘方面,经常需要在做特征工程和模型训练之前对数据进行清洗,剔除无效数据和异常数据,是一种基于密度的经典算法。
2.如权利要求1所述的方法,其中,所述对第一数据方和第二数据方的样本ID进行求交运算,获得所述第一数据方和所述第二数据方的交集样本ID,还包括:
判断所述第一数据方和所述第二数据方是否要求隐藏非交集样本ID;
如果所述第一数据方和所述第二数据方要求隐藏非交集样本ID,基于RSA加密的隐私求交方法对所述第一数据方和所述第二数据方进行求交,获得所述第一数据方和所述第二数据方的交集样本ID,其中,所述RSA加密是一种加密算法,是一种使用不同的加密密钥与解密密钥,由已知加密密钥推导出解密密钥在计算上是不可行的密码体制。
3.如权利要求1所述的方法,其中,所述对所述第一距离数据集和所述第二距离数据集进行拆分,获得第一数据碎片和第二数据碎片后,将所述第一数据碎片和所述第二数据碎片进行数据交换并进行加和,获得第一样本集合和第二样本集合,包括:
所述第一距离数据集记作DB,所述第二距离数据集记作DC,均为N*N大小的矩阵,其中,N为样本数;
所述第一数据方和所述第二数据方使用秘密共享方法,将DB,DC拆成DB1,DB2,DC1,DC2,其中,DB=DB1+DB2、DC=DC1+DC2;
所述第一数据方将DB2发送给所述第二数据方;
所述第二数据方将DC1发送给所述第一数据方;
所述第一数据方将DB1DC1加和成为D1,其中,所述D1为所述第一样本集合;
所述第二数据方将DB2DC2加和成为D2,其中,所述D2为所述第二样本集合。
4.如权利要求1所述的方法,其中,所述方法包括:
判断所述第一数据方和所述第二数据方的ID次序是否统一;
如果所述第一数据方和所述第二数据方的ID次序不统一,按照样本ID进行加和。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百融至信(北京)征信有限公司,未经百融至信(北京)征信有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210000395.X/1.html,转载请声明来源钻瓜专利网。