[发明专利]基于随机森林的人员的危险性分析方法在审
申请号: | 202110865209.4 | 申请日: | 2021-07-29 |
公开(公告)号: | CN113657726A | 公开(公告)日: | 2021-11-16 |
发明(设计)人: | 许金礼;廖淑珍;陆宇升;陶炜;朱晓东;吕思霖 | 申请(专利权)人: | 广西友迪资讯科技有限公司 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q50/26;G06K9/62;G06N20/00 |
代理公司: | 南宁启创知识产权代理事务所(特殊普通合伙) 45122 | 代理人: | 余小宁 |
地址: | 530000 广西壮族自治区南宁市*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 随机 森林 人员 危险性 分析 方法 | ||
1.一种基于随机森林的人员的危险性分析方法,其特征在于,包含目标类别选择、训练过程和评估过程;其中,
(1)目标类别选择:
在人员多维度数据中选择一个维度YD作为目标类别,所述YD与危险程度有关,
设置危险程度指标PYD,PYD指标值含义为被评估人员YD维度取值为1的概率值;
(2)训练过程:
a、建立初始数据集PreTrainSet,PreTrainSet数据集是一个样本集合,每个样本对应多维度人员数据中一个人员的数据;
b、训练随机森林分类模型RFM,在PreTrainSet数据集基础上,通过采样或SMOTE算法构造训练数据集TrainSet,使用TrainSet数据集训练随机森林分类模型RFM;
c、计算RFM中每个决策树的每个叶子节点的参数LNPY
所述RFM中包含k个决策树t1,t2,t3,...tk;将RFM中所有决策树的所有叶子节点放到统一的叶子节点数组lnodes中;
使用RFM对人员特征向量f进行回归,建立长度和lnodes相同的数组LNPY,计算命中叶子节点的所有PreTrainSet或TrainSet样本中label等于1的样本所占比例GPYD;
d、保存RFM、GPYD和LNPY;
(3)评估过程:
a、从存储介质加载训练过程得到的RFM、GPYD和LNPY;
b、用随机森林分类算法根据模型RFM对被评估人员进行分类,获得命中的RFM叶子节点,被评估人员将来被列为重点的概率计算PYD;
c、计算SPYD=PYD/GPYD;
d、PYD和SPYD,作为被评价人员的危险程度量化指标;
SPYD含义为被评估人员的危险性是平均水平的倍数;
当SPYD>1,表示被评估人员比多数人更危险;
SPYD<1,表示被评估人员比多数人更安全。
2.根据权利要求1所述基于随机森林的人员的危险性分析方法,其特征在于,所述步骤(1)目标类别选择中,YD是二值的,YD的值为1或0,其中1表示有危险倾向大的类别、0表示危险倾向小的类别,对应是、否两个类别。
3.根据权利要求1所述基于随机森林的人员的危险性分析方法,其特征在于,所述步骤(1)目标类别选择中,YD选择是否被列为重点、是否被使用器械、是否被使用约束性保护措施或分管等级。
4.根据权利要求3所述基于随机森林的人员的危险性分析方法,其特征在于,所述分管等级需预处理为多个二值的维度,首先将分管等级设置为严管、普管、宽管级别,每一级别拆分为是否严管、是否普管、是否宽管,即可选择其一作为目标类别YD。
5.根据权利要求1所述基于随机森林的人员的危险性分析方法,其特征在于,所述步骤(2)训练过程a中所述每个样本有两个列:label和features;YD的值为label,从多维度人员数据中提取和危险性有关的数据,构造features向量;PreTrainSet数据集中,label等于1的样本比例为全部历史数据中YD等于1的记录比例。
6.根据权利要求1所述基于随机森林的人员的危险性分析方法,其特征在于,所述步骤(2)训练过程b中所述TrainSet数据集中,label等于1的样本比例大于全部历史数据中YD等于1的记录比例。
7.根据权利要求1所述基于随机森林的人员的危险性分析方法,其特征在于,所述步骤(2)训练过程c中使用RFM对人员特征向量f进行回归,得到向量f在k个决策树中命中的叶子节点下标元组lnis=(ln1,ln2,...lnk),其中lni为向量f在第i个决策树中命中的叶子节点在lnodes中的下标。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广西友迪资讯科技有限公司,未经广西友迪资讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110865209.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种高温烟气热能回收系统
- 下一篇:一种通讯型单兵装备
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理