[发明专利]面向保密需求的海洋大数据敏感度评估系统及防范方法有效
申请号: | 201910060928.1 | 申请日: | 2019-01-23 |
公开(公告)号: | CN109800600B | 公开(公告)日: | 2020-11-24 |
发明(设计)人: | 王晓东;罗祥裕;解玮玮;魏志强;王雪 | 申请(专利权)人: | 中国海洋大学 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06F21/60 |
代理公司: | 青岛华慧泽专利代理事务所(普通合伙) 37247 | 代理人: | 张慧芳 |
地址: | 266100 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 面向 保密 需求 海洋 数据 敏感度 评估 系统 防范 方法 | ||
1.面向保密需求的海洋大数据敏感度评估系统,其特征在于,包括:
数据特征提取模块,用于提取数据特征,建立敏感特征库;及用于从海洋大数据目标处理数据中提取其数据属性特征;所述数据特征提取模块,用于从结构化的海洋秘密原始数据中提取数据样本和元数据信息,从非结构化的海洋秘密信息文档中抽取关键词、主题词、关联词建立语料库,并进行特征提取,使用基于词频和密级的特征权值方法确定候选词权重进行选择特征,并将特征词分类,归属于不同的属性类别,形成敏感特征库;及用于从海洋大数据目标处理数据中提取其数据属性特征,为下一步与敏感特征库匹配发现敏感数据做准备;
提取敏感特征的具体步骤如下:
(1)样本数据集分类;
(2)数值语义分析;
(3)关键词提取:使用分词工具对每类数据集进行分词,统计词频并记录所属数据集类别,使用基于词频和密级的特征权值方法确定候选词权重构建词语权值函数,对来自不同密级类别的候选词赋予不同的权重;每类样本中的词频统计使用基于TF-IDF算法的取最大值算法确定候选词的权值;将权值排序,取前n个词作为最终特征词,结合海洋领域知识对特征词进行语义分析,扩充敏感特征词库,形成最终的敏感特征库;
(4)敏感特征分类:分析敏感特征库中的特征词,将其归于不同的属性类别,包括但不局限于敏感时间、敏感区域、敏感观测要素;
敏感特征匹配模块,用于将海洋大数据中的目标处理数据特征与敏感特征库进行匹配,将目标处理数据集与原始敏感数据集进行相似性分析;
敏感特征量化模块,用于将提取的敏感特征作为参数建立敏感度评估模型,量化特征权重;
数据关联性分析模块,用于进一步分析发现敏感数据,通过关联性分析得出经过特征匹配识别出的数据集的关联数据集,匹配数据集与关联数据集共同构成敏感数据库;
数据敏感度度量模块,用于从匹配分析发现的数据集中通过分析计算确定敏感数据敏感度;具体过程如下:
a.构建敏感属性组,根据数据特征提取模块提取划分的敏感属性类别,设敏感属性集合为:
S={s1,s2,…,sn}(n≥2)
b.数据集的二进制化,将原数据集转换成二进制数据集,所有属性值只为0或1;
c.将提取到的属性特征与敏感特征库匹配,命中则记为1,否则记为0,进行这样数据集就转化为一个二进制数据集,累计所有属性的不同值的数量即为数据集维数;原数据集在二进制化之后,统计每个敏感属性值中“1”出现的频率,可以得到数据集的特征频率:
VⅠ={v11,v12,...,vnm}
最后,根据提取的敏感属性值权值与数据集的特征频率,可计算得出敏感属性si的敏感度:
其中,为第i个敏感属性的第j个属性值的加权TF-IDF值,vij为第i个敏感属性的第j个属性值的特征频率;
敏感数据保护模块,用于根据分析量化所得的敏感属性敏感度,有针对性地保护敏感数据。
2.利用权利要求1所述的面向保密需求的海洋大数据敏感度评估系统进行的防范方法,其特征在于,包括以下步骤:
步骤一、建立敏感特征库;
步骤二、匹配分析待处理数据集;
步骤三、构建敏感度评估模型;
步骤四、计算属性敏感度;
步骤五、保护敏感数据;
步骤六、动态优化敏感特征库。
3.根据权利要求2所述的防范方法,其特征在于,步骤二中,首先利用基于词频的特征提取方法,从海洋大数据目标处理数据集中提取待处理数据特征,利用离散化特征向量法将数据集转化为二进制向量,将待处理数据集与样本数据集进行相似性匹配,从而发现具有敏感特征的数据集,得到匹配数据集;从匹配数据集中再进行关联性分析,找到匹配数据集的关联数据集,二者共同构成敏感数据集。
4.根据权利要求2所述的防范方法,其特征在于,步骤三中,通过将样本集中的每类数据转化为特征向量,确定每一类的数据集的中心及阈值,判断待处理数据的向量位置与类中心的距离,即可确定数据敏感度类别;在某类阈值范围内,则属于该类敏感等级。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国海洋大学,未经中国海洋大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910060928.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种区块链分布式存储方法及系统
- 下一篇:一种基于区块链的互联网实名认证方法