[发明专利]基于文本挖掘的安全生产事故分析方法、装置、电子设备以及存储介质有效
申请号: | 202011148727.6 | 申请日: | 2020-10-23 |
公开(公告)号: | CN112364627B | 公开(公告)日: | 2023-07-25 |
发明(设计)人: | 张健钦;程宇航;李江川;张安 | 申请(专利权)人: | 北京建筑大学 |
主分类号: | G06F40/216 | 分类号: | G06F40/216;G06F16/35;G06F16/36;G06Q50/26 |
代理公司: | 北京远大卓悦知识产权代理有限公司 11369 | 代理人: | 卞静静 |
地址: | 102616 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 文本 挖掘 安全生产 事故 分析 方法 装置 电子设备 以及 存储 介质 | ||
1.一种基于文本挖掘的安全生产事故分析方法,其特征在于,包括:
获取安全生产事故文本数据,其中,所述安全生产事故文本数据包括分属于多个事故等级的多个事故文本;
采用TF-IDF方法,从所述安全生产事故文本数据中提取多个关键词,其中,任一关键词的权重与当前关键词在与其所在的事故文本属于相同事故等级的事故文本中的出现频率成正比;
根据所述多个关键词,确定所述安全生产事故的致因因素;
所述任一关键词的权重通过以下公式计算得出:
其中,
所述当前关键词的逆向文件频率通过以下公式计算得出:
其中,
2.如权利要求1所述的基于文本挖掘的安全生产事故分析方法,其特征在于,所述当前关键词在与其所在的事故文本属于相同事故等级的事故文本中的出现频率为根据含有当前关键词的并且与当前关键词所在的事故文本属于相同事故等级的事故文本数在含有当前关键词的事故文本总数中的占比计算得出。
3.如权利要求1所述的基于文本挖掘的安全生产事故分析方法,其特征在于,所述任一关键词的权重还与当前关键词在其所在的事故文本中的出现频率成正比,而与当前关键词在所述多个事故文本中的出现频率成反比。
4.如权利要求1所述的基于文本挖掘的安全生产事故分析方法,其特征在于,所述根据所述多个关键词,确定所述安全生产事故的致因因素,包括:
对所述多个关键词进行聚类;
根据所述多个关键词的聚类结果,将所述多个关键词划分至多个致因主题下,其中,所述多个致因主题与安全生产事故的多个致因因素一一对应;
根据各关键词的致因主题,确定含有各关键词的事故文本对应的安全生产事故的致因因素。
5.如权利要求4所述的基于文本挖掘的安全生产事故分析方法,其特征在于,所述根据所述多个关键词,确定所述安全生产事故的致因因素之后,所述方法还包括:
建立所述多个关键词与多个事故属性类别之间的关联关系;
建立对应有相同关键词的致因主题和事故属性类别之间的关联关系,并利用所对应的相同关键词的个数表示各致因主题与各事故属性类别之间的关联强度。
6.如权利要求5所述的基于文本挖掘的安全生产事故分析方法,其特征在于,所述致因因素包括人为因素、设备因素和/或其他因素。
7.如权利要求1所述的基于文本挖掘的安全生产事故分析方法,其特征在于,所述获取安全生产事故文本数据之后,所述方法还包括:
根据所述安全生产事故文本数据,构建知识图谱,其中,所述知识图谱中的实体类型包括存在伤亡的事故以及根据事故属性确定的其他实体类型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京建筑大学,未经北京建筑大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011148727.6/1.html,转载请声明来源钻瓜专利网。