[发明专利]服务器、员工泄露企业信息的预测方法及存储介质在审
申请号: | 201910064360.0 | 申请日: | 2019-01-23 |
公开(公告)号: | CN109918899A | 公开(公告)日: | 2019-06-21 |
发明(设计)人: | 王正;胡晶轩;薛志强;马刚 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F21/55 | 分类号: | G06F21/55 |
代理公司: | 深圳市沃德知识产权代理事务所(普通合伙) 44347 | 代理人: | 高杰;于志光 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 预测模型 指标数据 员工 企业信息 泄露 权重 预测 存储介质 样本数据 服务器 办公信息 操作信息 个人信息 习惯信息 信息泄露 解释性 丢弃 梳理 输出 防范 概率 | ||
1.一种服务器,其特征在于,所述服务器包括存储器及与所述存储器连接的处理器,所述存储器中存储有可在所述处理器上运行的处理系统,所述处理系统被所述处理器执行时实现如下步骤:
以员工操作信息、员工个人信息、员工办公信息和员工习惯信息为主因子进行逐级梳理,得到各个主因子的指标数据;
从企业的历史数据中获取已核实的泄露企业信息的员工的指标数据并为该员工标识对应的第一标签,以及获取未泄露企业信息的员工的指标数据并为该员工标识对应的第二标签,以每一员工对应的指标数据为样本数据,已核实的泄露企业信息的员工的指标数据及未泄露企业信息的员工的指标数据构成样本数据集;
利用预定的预测算法分别建立对应的各预测模型,将样本数据集中每一员工对应的样本数据输入至各预测模型,以对各预测模型进行训练;
获取各预测模型输出的指标数据及该指标数据对应的权重,若有预测模型的指标数据属于预定的非业务可解释性指标数据,且该指标数据对应的权重与除该指标数据外的其他指标数据的权重的相对差值大于预定的阈值,则丢弃该预测模型;
对于未丢弃的各预测模型,获取各预测模型的受试者工作特征曲线,并计算各预测模型的受试者工作特征曲线下对应的面积AUC,以该面积AUC最大的预测模型作为员工泄露企业信息的预测模型;
获取嫌疑员工的指标数据,将该指标数据输入至该员工泄露企业信息的预测模型中,获取输出的指标数据的权重,将输出的指标数据的权重相加得到该嫌疑员工泄露企业信息的概率值。
2.根据权利要求1所述的服务器,其特征在于,所述以员工操作信息、员工个人信息、员工办公信息和员工习惯信息为主因子进行逐级梳理,得到各个主因子的指标数据的步骤,具体包括:
以员工操作信息、员工个人信息、员工办公信息和员工习惯信息为主因子进行数据梳理,得到各主因子对应的各从因子,对各从因子进行数据梳理得到各次因子,对各次因子进行数据梳理得到各分因子,对各分因子进行数据梳理得到各分因子的指标数据。
3.根据权利要求2所述的服务器,其特征在于,所述处理系统被所述处理器执行时,还实现如下步骤:根据各主因子、各从因子、各次因子、各分因子及指标数据建立树形结构,将每一分因子对应的指标数据的权重相加得到该分因子的权重,将每一次因子对应的分因子的权重相加得到该次因子的权重,将每一从因子对应的次因子的权重相加得到该从因子的权重,将每一主因子对应的从因子的权重相加得到该主因子的权重,以供展示该树形结构及该树形结构中各主因子的权重、各从因子的权重、各次因子的权重、各分因子的权重及指标数据的权重。
4.根据权利要求1至3任一项所述的服务器,其特征在于,所述获取各预测模型的受试者工作特征曲线,并计算各预测模型的受试者工作特征曲线下对应的面积AUC的步骤,具体包括:
获取预测模型对应的真阴率TN、假阳率FP、假阴率FN及真阳率TP;
根据所述真阴率TN、假阳率FP计算假阳率:FPR=FP/(TN+FP);
根据所述假阴率FN、真阳率TP计算真阳率:TPR=TP/(TP+FN);
以假阳率FPR为横坐标,以真阳率TPR为纵坐标绘制该预测模型的受试者工作特征曲线,并计算该预测模型的受试者工作特征曲线下的面积AUC。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910064360.0/1.html,转载请声明来源钻瓜专利网。