[发明专利]一种基于数据映射的数据泄漏溯源判定方法及系统有效
申请号: | 201811612159.3 | 申请日: | 2018-12-27 |
公开(公告)号: | CN109739889B | 公开(公告)日: | 2020-12-08 |
发明(设计)人: | 闫炳豪;庄子迪;党美;刘会议 | 申请(专利权)人: | 北京三未信安科技发展有限公司 |
主分类号: | G06F16/2455 | 分类号: | G06F16/2455 |
代理公司: | 北京轻创知识产权代理有限公司 11212 | 代理人: | 杨立;赵秀斌 |
地址: | 100102 北京市朝阳区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 数据 映射 泄漏 溯源 判定 方法 系统 | ||
1.一种基于数据映射的数据泄漏溯源判定方法,其特征在于,包括:
步骤1、抽取原始数据集的子集作为交付数据集;
步骤2、对被抽取出的所述交付数据集中的每一条数据进行数据标记以标识交付对象;
步骤3、根据所述交付数据集中所有数据的数据标记的数量,建立所述交付对象的识别标签;
步骤3.1、按照交付对象分别统计所述交付数据集中所有子集的数据标记的数量;
步骤3.2、分别计算各个交付对象对应的数据标记的数量与所述交付数据集数据总量的比例;
步骤3.3、将计算得到的各个比例按照预设顺序排列构成的向量作为所述交付对象的识别标签;
步骤4、将待溯源数据集中的每一条数据,与所述原始数据集进行匹配,得到由所述原始数据集中匹配成功的数据构成的匹配数据集;
步骤5、统计所述匹配数据集中所有数据的数据标记的分布,结合所述识别标签,判定所述待溯源数据集所指向的交付对象;
步骤5.1、按照交付对象分别统计所述匹配数据集中所有数据的数据标记的数量;
步骤5.2、分别计算各个交付对象对应的数据标记的数量与所述匹配数据集数据总量的比例;
步骤5.3、将计算得到的各个比例按照预设顺序排列构成的向量作为匹配标签;
步骤5.4、将所述匹配标签与识别标签进行匹配,根据匹配结果判定所述待溯源数据集所指向的交易对象。
2.根据权利要求1所述的方法,其特征在于,所述步骤1具体包括:随机抽取原始数据集的预设比例的数据作为交付数据集。
3.根据权利要求1所述的方法,其特征在于,所述步骤4具体包括:将待溯源数据集中的每一条数据,与所述原始数据集中的各条数据进行相似度计算,将所述原始数据集中与所述待溯源数据集中数据的相似度最大且最大相似度大于预设阈值的数据加入匹配数据集。
4.一种基于数据映射的数据泄漏溯源判定系统,其特征在于,包括:
抽取模块,用于抽取原始数据集的子集作为交付数据集;
标记模块,用于对被抽取出的所述交付数据集中的每一条数据进行数据标记以标识交付对象;
建立模块,用于根据所述交付数据集中所有数据的数据标记的数量,建立所述交付对象的识别标签;
所述建立模块具体包括:
第一统计单元,用于按照交付对象分别统计所述交付数据集中所有子集的数据标记的数量;
第一计算单元,用于分别计算各个交付对象对应的数据标记的数量与所述交付数据集数据总量的比例;
第一排序单元,用于将计算得到的各个比例按照预设顺序排列构成的向量作为所述交付对象的识别标签;
匹配模块,用于将待溯源数据集中的每一条数据,与所述原始数据集进行匹配,得到由所述原始数据集中匹配成功的数据构成的匹配数据集;
判定模块,用于统计所述匹配数据集中所有数据的数据标记的分布,结合所述识别标签,判定所述待溯源数据集所指向的交付对象;
所述判定模块具体包括:
第二统计单元,用于按照交付对象分别统计所述匹配数据集中所有数据的数据标记的数量;
第二计算单元,用于分别计算各个交付对象对应的数据标记的数量与所述匹配数据集数据总量的比例;
第二排序单元,用于将计算得到的各个比例按照预设顺序排列构成的向量作为匹配标签;
判定单元,用于将所述匹配标签与识别标签进行匹配,根据匹配结果判定所述待溯源数据集所指向的交易对象。
5.根据权利要求4所述的系统,其特征在于,所述抽取模块,具体用于随机抽取原始数据集的预设比例的数据作为交付数据集。
6.根据权利要求4所述的系统,其特征在于,所述建立模块具体用于将待溯源数据集中的每一条数据,与所述原始数据集中的各条数据进行相似度计算,将所述原始数据集中与所述待溯源数据集中数据的相似度最大且最大相似度大于预设阈值的数据加入匹配数据集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京三未信安科技发展有限公司,未经北京三未信安科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811612159.3/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置