[发明专利]一种针对游戏业务中数据访问事件的安全策略生成方法有效
申请号: | 202110824250.7 | 申请日: | 2021-07-21 |
公开(公告)号: | CN113546426B | 公开(公告)日: | 2023-08-22 |
发明(设计)人: | 朱磊;皎玖圆;黑新宏;王一川;姬文江;孟海宁;盘隆;何萍;姚燕妮 | 申请(专利权)人: | 西安理工大学;深圳市腾讯计算机系统有限公司 |
主分类号: | A63F13/73 | 分类号: | A63F13/73;A63F13/75;G06F16/2458;G06F21/62 |
代理公司: | 西安弘理专利事务所 61214 | 代理人: | 韩玙 |
地址: | 710048 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 针对 游戏 业务 数据 访问 事件 安全策略 生成 方法 | ||
1.一种针对游戏业务中数据访问事件的安全策略生成方法,其特征在于,首先对源游戏数据表做预处理,然后通过优化后的FP-Growth算法对数据进行挖掘获取频繁项和关联关系;用获取到的频次特征和关联关系分别对游戏数据表列和行进行权限配置;充实数据特征库,以达到细化保护数据的目的,最后根据定义模型以及权限判决规则进行用户访问时的权限判决;
具体包括以下步骤:
步骤1,由于游戏数据的复杂性的特点,对游戏数据表进行数据清理并选择选择合适的最小支持;
所述步骤1具体步骤为:
步骤1.1:源数据处理;
将数据库和数据挖掘的对应关系进行解释定义;分析对象即数据源是数据库表,数据项为游戏数据表列,数据项值为该数据项的某一条数据具体的表示,事物按照数据库理解为一行数据;
如果某个数据项值出现率接近零或该数据项任意一个数据项值都没有重复此时删除该数据项,包括但不限于主键;若某数据项中存在大量空值且占比超过90%,则判定该数据项为无意义数据项;
步骤1.2:数据值与数据项的映射
为完成规则配置的转化,对数据项值获取关联关系的过程中需要清楚数据项值与数据项的映射关系,对数据源中的数据项值添加对应的数据项标识,此步骤需要在编码之前进行;
步骤1.3:最小支持度的选择
选用的FP-Growth算法进行频繁项的挖掘,在该算法中需构件拥有最小支持度的FP-Tree,涉及最小支持度的选择;首先计算每个数据项中数据项值的频率并求均值记作AI,I表示某个数据项;求AI在所占得比率,n为数据项总数,再求数据项中数据量占整个数据集的比例MI,以MI为AI对应权重相乘记作GI;将GI排序,选取中位数作为分界点;若处于高频的数据量大则选取所有数据,否则选取低频数据;取所选数据每个数据项的AI的平均值作为频繁项挖掘的支持度;采取本方法选择最小支持度是为了获取较多的频繁项;
步骤2,基于优化后的FP-Growth对游戏数据进行挖掘;
所述步骤2的具体步骤为:
选用的FP-Growth算法进行频繁项的挖掘,该算法在处理大规模数据集时存储大规模FP-Tree会出现失败,同时由于挖掘FP-Tree过程中的递归次数增加,造成挖掘效率变的极低,本方案使用基于优化后的FP-Growth进行数据挖掘;
本方案FP-Growth优化在于在Spark上进行并行运算;首先读取原数据,对数据集进行随机划分,使用数据集划分到不同的分区;然后对每个分区使用FP-Growth进行数据挖掘,最后将每个分区中挖掘的结果进行合并,得到整个数据集的挖掘结果并进行输出;
步骤3,获取数据项值在频繁项集出现频率,作为游戏数据表列权限配置输入;
所述步骤3的具体步骤为:
步骤3.1:根据最小支持度获取频繁项集
构造完的FP-Tree能显示所有关联的数据项值,单个数据项值频次满足最小支持度的情况下,需要挖掘FP-Tree中隐藏的关联数据项值,并且需要保证该频繁项符合最小支持度的要求,即出现频次高于设定阈值;最后得到数据项值关联,作为安全特征配置转化的输入;
步骤3.2:获取数据项在频繁项集出现频率
经过数据处理与频繁项挖掘后的数据将流向权限配置转化,由于选择使用的算法是对于数据项关联关系的分析,若需要将算法输出转化为权限规则配置,最明显的权限划分关系含义为“数据项出现频率”,记此安全特征为“数据项使用频率划分”;
根据可表示的权限含义,需要将算法输出进行以下转化,得到安全配置;首先需要对编码后的数据项值进行解码,使其恢复其原本的表示类型;在对数据项值进行编码前将数据项值V与数据项C进行对应,因此解码后的真实数据项值,同样与数据项有映射;将每一个频繁项中的数据项值替换成成对应的数据项,并且去除重复的数据项,得到的数据可表示为{{C},support(n)},记为S(n),n表示当前频繁项,设当前频繁项中的数据项总计为I,频繁项总计为N个,计算每一个频繁项的支持率,根据频繁项的支持率计算频繁项中各数据项出现频率Rc;
步骤4,获取权限配置,根据步骤三的结果最终获取的权限配置作用于游戏数据表列;
所述步骤4的具体步骤为:步骤3中Rc其中c表示某一个数据项,即第n个频繁项中的数据项c,计算结果表示该数据项在某一张游戏数据表中被关联的频率;根据专家给出经验在[0,1]的区间上划分四个频率区间,[0,0.25]低频,[025,0.5]较低频,[0.5,0.75]较高频,[0.75,1]高频,分别记为R1,R2,R3,R4;将数据项出现频率Rc对应到四个区间上;
按照安全特征的描述,该安全特征表示“数据项使用频率划分”,包含四个安全特征元素,每一个安全特征元素的含义即表示处于频率区间段的数据项,定义安全特征元素为F1:高频,F2:较高频,F3:较低频,F4:低频;高频出现的数据项优先级高,表示频繁出现的数据项在数据挖掘中占有更重要的地位,因此被保护等级也相应提高;安全特征元素关系为:{{F1}→{F1,F2,F3,F4},{F2}→{F2,F3,F4},{F3}→{F3,F4},{F4}→{F4},{}→{}},→表示“可访问”;即当用户拥有最高权限F1时即可访问游戏数据表中该列;
步骤5,选择置信度并筛选强关联关系,将得出的强关联关系作为数据表行权限配置输入;
所述步骤5的具体步骤为:
步骤5.1:经过挖掘算法获取到的频繁项要转化成权限规则配置,并且使作用对象为游戏数据表行,需要从各个频繁项中发现关联关系,再对关联关系进行评估后,从强关联关系中获取行权限配置,即需要进行数据行限制的条件;
假设一个频繁项V={v1,v2,…,vm},是一个包含m个数据项值的集合,且该频繁项支持度为support(V),在关联关系中该频繁项被称为m项集;该频繁项中的关联关系定义为
表示从该频繁项中取任意数据项值构成两个集合left:{vp,…}和right:{vq,…},且构成集合的数据项值不同,即两个集合不相等;该关联关系解释为对于一个事物,出现left集合中所有的数据项值,也出现right集合中所有数据项值的情况;并且描述这种关联关系的评价标准定义为置信度,置信度的计算公式为
即以该频繁项的支持度与仅出现右边集合中的数据项值的支持度作比值,在频繁项挖掘中认为如果包含多个数据项值的集合满足最小支持度,则其中任意的数据项值组合一定也满足最小支持度,且该频繁项与其支持度也存在于频繁项挖掘结果中;因此left项集的支持度可以直接从频繁项结果中获取;
步骤5.2:在所有关联关系中,若right集合中的数据项值总计多于left集合中的数据项值总计,即置信度大于1,将此类关联关系视为关联关系的逆关联;由于本文是针对大量数据的挖掘,所以此处随机选取0.1的数据,作为样本来计算整体置信度;对处于[0,1]区间的关联关系的置信度验证其分布规律,如果满足正态分布,根据先验知识获取95%置信度的置信区间,去掉较大值和较小值减小无用数据,将处于置信区间的关联关系作为下一步操作的输入;如果不符合正态分布,则将置信度在[0,1]区间的关联关系作为下一步操作的输入,此步骤主要为了筛选出一部分关联不强烈的规则,以减少评估参数计算的工作量;
在关联关系评价体系中,置信度由于忽略了事物整体的数量,同时没有考虑到不满足情况的数据量,仅以置信度无法完全确定关联关系成立,因此引入相关性系数,筛选关联关系;假设关联关系相关性系数的计算方法为
lift表示从A到B的相关性系数,如果lift大于1则表示正相关,反之如果小于1则说明负相关,如果lift等于1则认为A与B相互独立;
步骤5.3:为了确定这种关联关系是否是平衡的,使用不平衡因子IR,计算方法为
分子是关联关系两部分的支持度之差,分母是包含A和B的事物,如果IR越小,则表示此关联关系越稳定,即关联关系极有可能出现;
步骤6,获取权限配置,根据步骤5最终获取的权限配置作用于游戏数据表行;
所述步骤6的具体步骤为:通过步骤5筛选出的关联规则,我们可以认为这些关联关系中的数据项值之间存在某些联系,可能或造成数据的泄露,因此为了保护数据,使具有关联关系的数据不被随意访问,定义如下安全特征,该安全特征表示“关联数据是否允许访问”;假设经过筛选和评估得到的关联关系为
vp,vq为频繁项V中的数据项值,vp,vq对应的数据项,即游戏数据表列为cp,cq,定义安全特征元素E1:{filed:cp,operator:=,value:vp},E2:{filed:cq,operator:=,value:vq};
如果某一事物中即游戏数据表行中的元素vp,vq∈V之间存在关联关系,则赋予该事物标签E1:{filed:cp,operator:=,value:vp},E2:{filed:cq,operator:=,value:vq};若用户仅持有E1、E2其中一个标签访问权限则可以访问关联关系中对应的数据,仅当用户同时持有E1、E2对应权限时可访问该事物所有数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安理工大学;深圳市腾讯计算机系统有限公司,未经西安理工大学;深圳市腾讯计算机系统有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110824250.7/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置