[发明专利]一种基于NLP大数据的安全生产风险评估方法在审
申请号: | 202010534132.8 | 申请日: | 2020-06-12 |
公开(公告)号: | CN111667192A | 公开(公告)日: | 2020-09-15 |
发明(设计)人: | 赖兆红 | 申请(专利权)人: | 北京卓越讯通科技有限公司 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06F40/289;G06N3/08 |
代理公司: | 北京智行阳光知识产权代理事务所(普通合伙) 11738 | 代理人: | 黄锦阳 |
地址: | 100102 北京市朝阳区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 nlp 数据 安全生产 风险 评估 方法 | ||
本发明公开了一种基于NLP大数据的安全生产风险评估方法,第一步对语料库按段落清洗、去掉数字和特殊字符;第二步根据预定义的分词算法进行分词和段落为单元对每个词计算输入向量V‑input;第三步采用人工神经网络获取隐藏层神经元数值;第四步计算每一个词的神经网络输出;第五步为通过SoftMax计算每个词输出概率值;第六步为输出数值比对,如果不满足则通过代价函数和梯度函数调整学习权重。第七步为反复循环第一步和第六步完成训练。最后根据特征词向量距离和词频获取该风险特征词的权重值作为风险评估的输入。本发明通过已知事故的描述数据来获取风险的关联特征词,得到相关的风险因子或风险源增加安全生产风险数据源输入,提升了安全生产风险评估可靠性。
技术领域
本发明涉及NLP大数据风险评估技术领域,具体为一种基于NLP大数据的安全生产风险评估方法。
背景技术
目前安全生产风险评估通常采用层次分析法AHP(Analytic HierarchyProcess)、HAZOP(Hazard and Operability analysis,危害与可操作性分析)和SCL等风险评估方法。AHP层次分析方法是认为安全生产风险是由不同的因素组成,并按照因素间的相互关联影响以及隶属关系将因素按不同的层次聚集组合,形成一个多层次的分析结构模型,并且从最低层(供决策的方案、措施等)相对于最高层(总目标)的相对重要行给赋予不同的权值。这个权重赋值通常采用专家经验值的方法。而HAZOP风险评估方法也是基于生产经验对每个过程涉及的环节和操作进行打分评估的一种方式。SCL是基于经验的方法,通过列出工艺设备和操作有关的已知类型的危害、设计缺陷表进行评估的方式。这些方法忽略了一个重要的数据来源,即安全生产的事故描述数据和生产过程的隐患数据。这类数据属于文本类型,无法直接进行定量的分析。
因此,以上问题需要解决。
发明内容
本发明的目的在于提供一种基于NLP大数据的安全生产风险评估方法,本发明解决的技术问题:一是如何采用NLP大数据技术手段从海量的安全生产相关文本数据发现风险因子(风险源特征词),从而提升安全生产风险评估的科学性和可靠性。二是在某些事故数据不足场景下(因为有些安全生产事故场景5是无法重复)如何通过NLP大数据技术解决低频风险特征词难以识别的问题。
为了解决上述技术问题,本发明提供如下技术方案:
一种基于NLP大数据的安全生产风险评估方法,包括以下步骤:
步骤102:准备安全生产风险评估语料库,对语料库按段落切分、清洗、去掉数字和特殊字符;
步骤103:根据预定义的分词算法对段进行分词和以段落为单元对每个词计算输入向量V-input;所述输入向量V-input采用one-hot-representation方法;
步骤104:采用人工神经网络计算隐藏层数据,获取每个词的隐藏层值;人工神经网络计算方法为:每个词向量乘以输入神经网络学习矩阵得出隐藏神经元的数值,输入学习矩阵大小为VxN,其中V代表输入的词个数,N代表的是隐藏层神经元数;
步骤105:通过隐藏层神经元数值和学习权重矩阵,计算输出值;计算输出值的计算方法为:隐藏层的数据乘以输出学习矩阵(大小为NxV),即得到输出值;
步骤106:通过SoftMax对每个输出值计算对应的概率和进行归一化处理,如果概率输出大于80%,否则通过梯度函数反向调整神经网络学习矩阵权值,直到满足输出结果则符合要求;
其中SoftMax函数为:对输出值Xi进行求和作为分母,然后Xi除以分母即得出每个输出值的概率,见如下公式,公式1:
神经网络的cost损失函数为如下,其中Wo为输出词word的值,Wi为目标值,公式2:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京卓越讯通科技有限公司,未经北京卓越讯通科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010534132.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种分项电量负荷识别系统及方法
- 下一篇:一种切削液、清洗液过滤处理系统
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置