[发明专利]基于随机森林的人员的危险性分析方法在审
申请号: | 202110865209.4 | 申请日: | 2021-07-29 |
公开(公告)号: | CN113657726A | 公开(公告)日: | 2021-11-16 |
发明(设计)人: | 许金礼;廖淑珍;陆宇升;陶炜;朱晓东;吕思霖 | 申请(专利权)人: | 广西友迪资讯科技有限公司 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q50/26;G06K9/62;G06N20/00 |
代理公司: | 南宁启创知识产权代理事务所(特殊普通合伙) 45122 | 代理人: | 余小宁 |
地址: | 530000 广西壮族自治区南宁市*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 随机 森林 人员 危险性 分析 方法 | ||
本发明公开一种基于随机森林的人员的危险性分析方法,本发明涉及机器学习领域,包含目标类别选择、训练过程和评估过程;在人员多维度数据中选择与危险程度有关的YD作为目标类别,设置危险程度指标PYD,建立训练数据集PreTrainSet集合,训练随机森林回归模型得到RFM、GPYD和LNPY,计算得到被评估人员的危险性是平均水平的倍数SPYD,很直观评估出相对危险性大小。本发明评估方法训练数据中不包含人的主观判断或者量表测试结果,模型质量更高,同时也降低数据标注成本,加快模型更新速度,使得模型能够更快速更低成本地适应环境变化。
技术领域
本发明涉及机器学习领域,尤其涉及一种基于随机森林的人员的危险性分析方法。
背景技术
目前人员危险性评估主要有三种:一是经验型评估,由于受当时的条件限制,危险性评估的方式主要依据评估者对改造表现的直观感觉来界定,这类方法依赖评估者主观判断,总体准确率不高,而且评估过程中的关键是依靠评估者的素质,对于同一名待评价人员,不同评估者的结论可能差别较大;二是量表型评估,实现评估过程标准化和规范化,评估准确率不再依赖评估者的主观判断,但成熟有效的量表编制耗时非常长,多数量表在使用中不能随着社会环境、地理区域、人文风俗、成因等变化而区别对待;第三种是基于机器学习数据驱动的危险性评估方法,依靠多年积累的多维度数据,使用机器学习算法训练分类模型,再通过训练好的模型对待评价人员进行分类。
基于机器学习的危险性评估方法目前总体上仍然处于探索阶段,但是在实际操作过程中,普遍存在操作难度较大、评估信度效度较低的问题。现有的方法均基于经验,多采用分类的形式,即把待评价人员分为危险和非危险两类,或者分为高危、中危、低危等少数几个类别,缺乏量化的危险程度指标,无法精确区分一个类别中不同待评价人员危险程度的不同;其次,训练数据集的标注方法依赖于主观判断或者量表测试结果,不仅标注成本高昂,如前所述主观判断和量表测试都存在较大误差,导致训练数据集精确度也不高,有误差的训练数据训练出的模型必然精确度不高。有的方法虽然可以得到定量的危险程度指标,但难以解释其数值的含义,使用者难以理解和把握,无法快速灵活改变参数,难以适应新技术发展、信息系统和相关制度变化带来的环境变化。
因此,现需研究一种容易理解和把握、且适应性高、灵活度高的人员危险性分析方法。
发明内容
为解决上述技术问题,本发明提供一种基于随机森林的人员的危险性分析方法,建立的评估方法训练数据中不包含人的主观判断或者量表测试结果,模型质量更高,同时也降低数据标注成本,加快模型更新速度,使得模型能够更快速更低成本地适应环境变化。
为实现上述目的,本发明提供如下技术方案:
一种基于随机森林的人员的危险性分析方法,包含目标函数和特征的选择、训练模型和评估过程;其中,
(1)目标类别选择:
在人员多维度数据中选择一个维度YD作为目标类别,所述YD与危险程度有关,
设置危险程度指标PYD,PYD指标值含义为被评估人员YD维度取值为1的概率值;
(2)训练过程:
a、建立初始数据集PreTrainSet,PreTrainSet数据集是一个样本集合,每个样本对应多维度人员数据中一个人员的数据;
b、训练随机森林分类模型RFM,使用PreTrainSet数据集训练随机森林分类模型RFM;
或,在PreTrainSet数据集基础上,通过采样或SMOTE算法构造训练数据集TrainSet,使用TrainSet数据集训练随机森林分类模型RFM;
c、计算RFM中每个决策树的每个叶子节点的参数LNPY
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广西友迪资讯科技有限公司,未经广西友迪资讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110865209.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种高温烟气热能回收系统
- 下一篇:一种通讯型单兵装备
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理