[发明专利]一种基于大数据的电网信息安全可信工作系统有效

专利信息
申请号: 201610524803.6 申请日: 2016-07-01
公开(公告)号: CN106126741B 公开(公告)日: 2017-05-31
发明(设计)人: 陈祖斌;谢铭;胡继军;翁小云;袁勇;邓戈锋;莫英红;谢菁;张鹏;唐玲丽;黄连月;曾明霏;杭聪;贺冠博;王海;黎新;何钟柱 申请(专利权)人: 广西电网有限责任公司
主分类号: G06F17/30 分类号: G06F17/30;G06F21/32;G06F21/62;G06F21/78;G06Q50/06
代理公司: 北京高航知识产权代理有限公司11530 代理人: 吴强
地址: 530000 广西*** 国省代码: 广西;45
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种基于大数据的电网信息安全可信工作系统,该系统架构是在具有保护性功能、认证和完整性度量等特征基础上构建一种可信度评估机制和可信关系传递机制,包括数据质量管理模块、有用数据挖掘模块、身份验证模块和可信评估模块,其中质量管理模块包括数据描述子模块、数据质量评价子模块和数据质量分级管理子模块,有用数据挖掘模块包括数据预处理子模块、有用数据构建子模块、有用数据修正子模块和有用数据分层挖掘子模块,身份验证模块包括指纹识别子模块和报警子模块。
搜索关键词: 一种 基于 数据 电网 信息 安全 可信 工作 系统
【主权项】:
一种基于大数据的电网信息安全可信工作系统,其特征是,包括数据质量管理模块、有用数据挖掘模块、身份验证模块和可信评估模块,其中数据质量管理模块包括数据描述子模块、数据质量评价子模块和数据质量分级管理子模块,有用数据挖掘模块包括数据预处理子模块、有用数据构建子模块、有用数据修正子模块和有用数据分层挖掘子模块,身份验证模块包括指纹识别子模块和报警子模块;(1)数据描述子模块通过引入可信数据本身的属性和数据影响者的属性来描述数据,数据本身的属性用数据大小、创建日期、包含图片数、相关数据量表示,其中,相关数据量为当前数据指向的其它数据和指向当前数据的其它数据的总和;数据影响者的属性用影响者网络聚类系数来表示,由以下方法得到:构建数据影响者描述网络,对于每一个数据而言,影响者包括多个用户和一个管理者,其每个影响者都代表一个节点,用户可以浏览数据,也可以对数据提出修改的建议,而管理者既可以自行对数据进行修改,也可以根据用户建议进行修改,则影响者网络聚类系数定义为:K‾=mσ1+lσ2+n(δ1×σ3+δ2×σ4)m+l+n×1-(m-lm)3]]>式中,σ1表示用户每浏览一次数据施加的影响因子,m表示用户浏览总次数;σ2表示用户每提出一次修改意见施加的影响因子,l表示用户提出建议总次数;σ3表示管理者每自行修改一次数据施加的影响因子,σ4表示管理者每根据用户建议修改一次数据施加的影响因子,δ1和δ2分别为σ3和σ4权值,n表示管理者修改总次数;为用户修改频率系数,用于表示用户对数据的满意程度,该系数越大表明用户对数据的修改越频繁;(2)数据质量评价子模块采用“三级评价模型”对可信数据质量进行评价,首先根据数据大小将数据分为三类,然后综合数据的除数据大小外的其它全部属性对其数据质量进行评价,具体方法如下:将样本数据划分为高质量数据、中质量数据和低质量数据,若数据大小大于阈值T1,则该数据属于高质量数据,若数据大小大于阀值T2但是小于阀值T1,则该数据属于中质量数据,若数据大小小于阀值T2,则该数据属于低质量数据,T1>T2且T1、T2的取值范围是[1KB,1MB];进一步将高质量数据和低质量划分为不同等级,选取数据的其它全部属性组成向量,并根据样本数据计算每个等级的各个数据属性的均值,为每个等级建立相应的均值向量,新数据向量用X=(x1,…,xN)表示,某个等级的均值向量用Y=(y1,…,yN)表示,N表示除数据大小外数据的其它全部属性个数,两个向量的相似度用相似度函数R(X,Y)表示:R(X,Y)=Σi=1N|xi-yixi|2+Σi=1N|xi-yiyi|2]]>R(X,Y)值越小,则表明相似度越大,反之,则相似度越小,每个数据分别计算与不同等级的均值向量的相似度,从而确认其质量等级;(3)数据质量分级管理子模块可信数据通过数据质量评价子模块后被划分为不同质量等级,根据数据等级不同对数据进行分级管理;(4)指纹识别子模块访问电网信息数据需要输入指纹,与指纹库中的指纹进行匹配,只有通过指纹识别的人才能对电网信息数据进行访问;(5)报警子模块若未通过指纹识别,无法对电网信息进行访问,系统发出警报;所述数据预处理子模块:将数据划分为不同领域,根据用户需求确定客户所需数据领域,使用上述的三级评价模型对领域中的高质量高等级数据进行筛选,组成一个新的数据表K;所述有用数据构建子模块:经过预处理的数据,每个数据领域包含了不同的分类,引入相关系数P筛选有用数据分类:P=ZsZ-ρ1-ρ]]>式中,Zs表示新数据表K一个分类中数据双向指向的数量,即对于数据A和B,既能从A指向B,也能从B指向A,Z表示数据表K一个分类中的相关数据量,其中N表示一个分类中数据的总数;所述有用数据修正子模块:有用数据在使用过程中,会受到人为破坏和用户投票两个方面的影响,根据这两方面修正后的相关系数为P′;同时设定阈值T,T∈(0,0.1],若P′>T,则表明这个分类是有用数据;当从高质量数据无法得到符合条件的有用数据时,依次在中质量数据和低质量数据中进行查找符合条件的有用数据,并且当所有数据查找完毕后,如果最终得到的P′最大值小于T,或者虽然P′的最大值大于T但是其与阀值T的差值的绝对值小于设定值C,表明无法找到有用数据或者虽然可以找到有用数据但是得到的有用数据相关度已经低于预期,则此时自动对管理者发出提示,修改或者增加相关数据;取C=T/5;所述有用数据分层挖掘子模块:首先扫描数据表K,假设P′的最大值和最小值分别为P′max和P′min,将数据表K分割成个非重叠区域,并行挖掘出局部频繁项集,其中int为取整函数;然后利用先验性质,连接局部频繁项集得到全局候选项集;再次扫描K统计出每个候选项集的实际支持度以确定全局频繁项集;有用数据修正子模块中根据人为破坏和用户投票进行修正的具体修正公式为:P′=P×(1‑Y)×(1+H)式中,Y表示数据受到人为破坏的概率,H表示投票用户占总人数的比例;所述可信评估模块包括以下子模块:子模块1:定义用于可信评估模块的各项可信属性,可信属性是分类的,可信属性可以向下分解为子属性;子模块2:对于每项可信属性或子属性,提炼出对它的评价指标,用这些评价指标从不同的侧面对可信属性或子属性进行评价;子模块3:对于每项可信属性或子属性,定义出对它的评价标准,评价标准分为四级:优、良、中、差,评价标准是基于评价指标的,即根据每个评价指标的取值组合来决定可信属性或子属性达到了哪一级评价标准;子模块4:确定可信评估模块可信分级的标准,可信分级标准分为五级,是根据每项可信属性的评价结论而得出的;子模块5:在开展可信评估活动之前,根据评估重点的不同,形成不同可信评估模板,并基于此模板开展可信评估活动。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广西电网有限责任公司,未经广西电网有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201610524803.6/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top