[发明专利]一种基于NLP大数据的安全生产风险评估方法在审

专利信息
申请号: 202010534132.8 申请日: 2020-06-12
公开(公告)号: CN111667192A 公开(公告)日: 2020-09-15
发明(设计)人: 赖兆红 申请(专利权)人: 北京卓越讯通科技有限公司
主分类号: G06Q10/06 分类号: G06Q10/06;G06F40/289;G06N3/08
代理公司: 北京智行阳光知识产权代理事务所(普通合伙) 11738 代理人: 黄锦阳
地址: 100102 北京市朝阳区*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 nlp 数据 安全生产 风险 评估 方法
【权利要求书】:

1.一种基于NLP大数据的安全生产风险评估方法,其特征在于,包括以下步骤:

步骤102:准备安全生产风险评估语料库,对语料库按段落切分、清洗、去掉数字和特殊字符;

步骤103:根据预定义的分词算法对段进行分词和以段落为单元对每个词计算输入向量V-input;所述输入向量V-input采用one-hot-representation方法;

步骤104:采用人工神经网络计算隐藏层数据,获取每个词的隐藏层值;人工神经网络计算方法为:每个词向量乘以输入神经网络学习矩阵得出隐藏神经元的数值,输入学习矩阵大小为VxN,其中V代表输入的词个数,N代表的是隐藏层神经元数;

步骤105:通过隐藏层神经元数值和学习权重矩阵,计算输出值;计算输出值的计算方法为:隐藏层的数据乘以输出学习矩阵(大小为NxV),即得到输出值;

步骤106:通过SoftMax对每个输出值计算对应的概率和进行归一化处理,如果概率输出大于80%,否则通过梯度函数反向调整神经网络学习矩阵权值,直到满足输出结果则符合要求;

其中SoftMax函数为:对输出值Xi进行求和作为分母,然后Xi除以分母即得出每个输出值的概率,见如下公式,公式1:

神经网络的cost损失函数为如下,其中Wo为输出词word的值,Wi为目标值,公式2:

E=-log P(wO|wI)

更新神经网络学习矩阵的梯度函数为如下,其中h为隐藏层数值,W为学习矩阵,公式3:

和最后学习权重更新计算公式为,公式4:

步骤107:判断学习输出值是否满足要求,是则进入步骤108,否则重复102-106步骤;

步骤108:判断训练数据是否结束,是则进入步骤109,否则重复步骤102-步骤107,一直到训练数据结束;

步骤109:保存学习结果数据,通过根据安全生产风险的关键词如透水,获取关联词特征词,把特征词定义为风险因子;

步骤110:采用余弦算法对关键词和特征词的向量计算距离dist,所述风险因子权重值定义为关联距离乘以特征词的词频freq,即w=dist*freq作为安全生产风险评估新的因子输入。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京卓越讯通科技有限公司,未经北京卓越讯通科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010534132.8/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top