[发明专利]企业隐患和事故知识图谱构建方法、电子设备、存储介质在审
申请号: | 202010542675.4 | 申请日: | 2020-06-15 |
公开(公告)号: | CN111898852A | 公开(公告)日: | 2020-11-06 |
发明(设计)人: | 罗敏静;卿亮 | 申请(专利权)人: | 广州智能科技发展有限公司 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06F16/36;G06F40/295;G06N5/04 |
代理公司: | 广州市越秀区哲力专利商标事务所(普通合伙) 44288 | 代理人: | 葛燕婷 |
地址: | 510635 广东省广州市天河区*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 企业 隐患 事故 知识 图谱 构建 方法 电子设备 存储 介质 | ||
1.企业隐患和事故知识图谱构建方法,其特征在于,包括以下步骤:
企业隐患和事故知识抽取,从企业隐患和事故数据中提取出实体、关系、属性,将所述实体、关系、属性存入知识库;
企业隐患和事故知识融合,对所述知识库的内容进行整合、消歧、加工;
企业隐患和事故知识计算,通过知识推理推断出缺失事实。
2.如权利要求1所述的企业隐患和事故知识图谱构建方法,其特征在于,所述企业隐患和事故知识抽取步骤包括:
实体抽取,利用已标注的实体三元组在自然语言表述上的共性和差异,对多种企业隐患和事故实体关系内的数据分布进行联合编码,从生成模型的角度去发现未被标注的关系实体三元组;
关系抽取,通过从实体对正标签进行学习的远程监督提取算法从非结构化企业隐患和事故文本中进行关系抽取;
属性抽取,抽取实体的属性值。
3.如权利要求2所述的企业隐患和事故知识图谱构建方法,其特征在于:所述关系抽取步骤中,所述从实体对正标签进行学习的远程监督提取算法具体为基于远程监督的循环神经网络模型;利用循环神经网络抓取实体的描述特征,丰富实体表示,并通过计算实体间关系与句子间的相似度赋予句子不同的权重。
4.如权利要求1所述的企业隐患和事故知识图谱构建方法,其特征在于:在所述企业隐患和事故知识抽取步骤和所述企业隐患和事故知识融合步骤之间还包括收集基础数据,收集企业的各大隐患数据、各大企业事故数据、需要标注的实体类别、数量、关系。
5.如权利要求1所述的企业隐患和事故知识图谱构建方法,其特征在于,所述企业隐患和事故知识融合步骤包括:
实体对齐,通过实体对齐算法迭代标注出异构数据中的实体对齐;
实体链接,利用企业隐患和事故知识库中的实体对从企业大数据的文本中获取的实体指代进行消岐;
关系推演,将从企业大数据文本中获取的实体关系动态扩展到知识库中。
6.如权利要求5所述的企业隐患和事故知识图谱构建方法,其特征在于:所述实体对齐步骤中,所述实体对齐包括成对实体对齐和集成实体对齐,所述实体对齐算法包括概率统计模型、Bootstrapping算法;
所述实体链接步骤包括:
基于实体属性的实体链接,通过计算实体的名字属性中字符串的相似度判断实体是否相同,计算公式如下:
其中,SimCosine()表示通过Consine距离计算实体名称和属性的相似度,SimJaccard()表示通过Jaccard相关系数计算实体名称和属性的相似度,e1、e2为给定的实体,A(e)表示实体的属性字符串;
基于实体流行度的实体链接,对于给定的实体指代,确定与其对应的映射实体为企业隐患和事故数据库中最为公认的实体,计算公式如下:
其中,e表示给定的实体,P(e)表示实体e的流行度,#()表示次数;
基于上下文的实体链接,通过计算给定实体的上下文之间的相似性判断两个实体之间是否为同一实体;
基于外部证据的实体链接,通过实体之间的语义相关性判断两个实体之间是否为同一实体。
7.如权利要求5所述的企业隐患和事故知识图谱构建方法,其特征在于:所述关系推演步骤包括判定两个实体关系是否表示同一种关系,通过嵌入学习方法在嵌入空间中寻找能量函数学习实体的嵌入表示,利用实体的嵌入表达实体关系,并判断两个描述实体的关系是否表达同一种关系,将实体关系进行结构映射。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州智能科技发展有限公司,未经广州智能科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010542675.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种适于中药提取浓缩的循环神经网络控制方法和系统
- 下一篇:一种氛围投影灯
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理