[发明专利]一种基于逻辑回归的员工操作风险预测方法有效
申请号: | 202011491129.9 | 申请日: | 2020-12-17 |
公开(公告)号: | CN112418738B | 公开(公告)日: | 2022-02-11 |
发明(设计)人: | 向阳;李锦松;颜科琦;陈继春;黄文;邬小峰;岳雨蒂;程云;黄奕乐;张欣华;崔文军;李威;曾浩;王承林 | 申请(专利权)人: | 泸州银行股份有限公司;富华融科(成都)科技有限公司;泸州老窖集团有限责任公司 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q10/04;G06N20/00;G06Q40/02 |
代理公司: | 成都九鼎天元知识产权代理有限公司 51214 | 代理人: | 徐静 |
地址: | 646000 四川省泸*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 逻辑 回归 员工 操作 风险 预测 方法 | ||
1.一种基于逻辑回归的员工操作风险预测方法,其特征在于,包括如下步骤:
S1,采集操作风险点清单数据和员工信息数据;所述员工信息数据包含以下采集范围:
a.基础信息,包括:性别、年龄、教育水平、所属部门、岗位、请假次数、请假时长和调休时长;
b.工作信息,包括:工作内容、工作行为:在各系统中的登录、操作情况、任务数量、完成情况、任务完成耗时;职责权限、工作能力;工作沟通、工作日记:工作圈信息更新时间、工作圈信息条数、工作圈信息内容、沟通情况、工作日志更新次数、工作日志更新内容、公告阅读时长和公告阅读次数;
c.资金往来信息,包括:员工存款账户、交易内容、交易对手、交易金额、交易时间、员工投资账号、投资金额和投资时间;
d.操作风险信息,包括:操作风险事件库中的员工发生的操作风险事件和风险事件严重性;
S2,根据影响程度对所述操作风险点清单数据中的风险点进行分类;影响程度包括:涉及金额、法律影响、名誉影响、涉及范围和风险内容;
S3,提取各类风险点的操作风险事件和员工信息数据形成操作风险数据集;操作风险数据集中包括了该类风险点的操作风险事件,以及与该类风险点有关的员工信息数据;
S4,根据每类风险点操作风险数据集中的操作风险事件的发生情况给员工打标签;步骤S4中给员工打标签的方法为:发生过此类风险点的操作风险事件的员工在该类风险点的操作风险事件的标签为1,未发生过此类风险点的操作风险事件的员工在该类风险点的操作风险事件的标签为0;
S5,对每类风险点操作风险数据集中的员工信息数据分别进行数据预处理;步骤S5中所述数据预处理包括:
数据清洗:异常值处理、缺失值处理、重复值删除、定性变量转化为数值型变量、以及日期由文本格式转换为时间格式;
生成衍生变量:将数据清洗后的员工信息数据作为原始变量,通过设计衍生条件得到原始变量的衍生变量;
S6,基于员工标签,对每类风险点分别建立逻辑回归模型;
S7,使用经数据预处理后每类风险点操作风险数据集中的员工信息数据训练对应的逻辑回归模型;步骤S7包括如下子步骤:
S71,将所属风险点类别的员工信息数据的原始变量和衍生变量划分为训练集和测试集;
S72,采用相关性分析和方差膨胀因子对训练集进行变量初筛;
S73,计算woe值和iv值,并根据计算得到的iv值从初筛后的训练集中选择要输入逻辑回归模型的输入数据;首先使用自动分箱函数将连续变量进行分箱离散化,在自动分箱函数中使用卡方检验合并分布类似的连续变量的箱子和分类变量的类别箱子,确定所有变量的箱子个数、箱子区间和woe值;系统给出推荐箱子个数,客户根据系统界面给出的变量好坏员工分布直方图对该变量的箱子个数进行调整;然后根据计算的woe值计算所有变量的iv值,iv值从初筛后的训练集中选择要输入逻辑回归模型的输入数据;其中,可以首先设定一个iv阈值筛选出iv值大的变量推荐给用户,再由用户在筛选后的变量中选择iv值大的变量作为逻辑回归模型的输入数据;
S74,选择的输入数据输入所述逻辑回归模型,并利用损失函数对所述逻辑回归模型进行训练;
S75,使用测试集输入训练后的逻辑回归模型进行评估,通过评估的逻辑回归模型即为训练好的逻辑回归模型;
S76,当采集的操作风险点清单数据和员工信息数据有更新,则将所述逻辑回归模型随之更新;
S8,利用训练好的逻辑回归模型计算员工发生各类操作风险事件的概率;步骤S8还包括,设定概率阈值,通过比较所述概率阈值与计算得到的员工发生各类操作风险事件的概率进行预警;所述概率阈值有多个,分别表示不同的风险影响程度;
S9,收集并统计员工发生各类操作风险事件的实际情况,将计算得到的员工发生各类操作风险事件的概率与实际情况进行比对,根据比对结果对所述逻辑回归模型进行优化;具体为:监控当前逻辑回归模型预测效果,指标包括:模型区分能力ks值、模型预测准确性、模型稳定性PSI、模型误放率、好员工预测准确率、坏员工预测准确率;对逻辑回归模型进行持续监控,通过折线图对比模型不同时期变化趋势,在模型效果下降时及时调整模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于泸州银行股份有限公司;富华融科(成都)科技有限公司;泸州老窖集团有限责任公司,未经泸州银行股份有限公司;富华融科(成都)科技有限公司;泸州老窖集团有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011491129.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种痔疮药
- 下一篇:虚拟票券激活方法、装置、终端及存储介质
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理