[发明专利]一种行业工艺领域知识图谱构建方法及装置有效
申请号: | 202010210748.X | 申请日: | 2020-03-24 |
公开(公告)号: | CN111444351B | 公开(公告)日: | 2023-09-12 |
发明(设计)人: | 何炜琪;董世元;刘娜;吴志杰;刘毅 | 申请(专利权)人: | 清华苏州环境创新研究院;清华大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F40/295;G06F40/30;G06Q10/0631;G06Q50/04 |
代理公司: | 苏州创元专利商标事务所有限公司 32103 | 代理人: | 范晴;丁浩秋 |
地址: | 215000 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 行业 工艺 领域 知识 图谱 构建 方法 装置 | ||
本发明公开了一种行业工艺领域知识图谱构建方法,包括:获取某行业工艺领域的开放数据源,建立原始资料数据库;根据结构化和半结构化资料提取工艺技术知识信息,构建知识图谱数据层;结合专家知识和行业调研,建立知识图谱模式层,并建立知识图谱模式层和数据层之间的映射关系;将构建的知识图谱数据层作为样本库,利用自监督学习方法提取非结构化资料中包含的实体、关系及实体属性信息,并依据建立的知识图谱数据层和模式层之间的映射关系,补充知识图谱数据层;对知识图谱数据层进行知识融合和知识推理,得到领域知识图谱。提高了领域概念体系建设效率,并为多行业工艺领域知识图谱建设提供参考,可以为企业工艺优化升级提供支撑。
技术领域
本发明属于知识图谱库构建技术领域,具体地涉及一种行业工艺领域知识图谱构建方法及装置,尤其适用于水泥行业的工艺。
背景技术
传统的行业工艺领域技术库和专家库的建设过程过于依赖人工,且成本高,难以建立多行业工艺领域的技术库。在实际应用中,传统的技术库是个半结构化资料,在解决行业企业实际面临问题时,依旧需要人工辅助决策。
在传统专业领域知识图谱构建中,一般采用领域专家和众包的方式人工构建本体,用于描述专业领域概念层次体系,然而人工方式工作量巨大,且对于专家要求较高,难以应用于大批量的专业领域知识图谱构建。同时人工构建的概念层次体系,人为干预知识信息,一方面难以将领域内所有知识信息概括完全,容易造成知识信息的缺损。另一方面容易造成某一方面的知识冗余。
近年来,我国经济发展迅速,经济发展伴随着与日俱增的能源需求和日益突出的环境污染,为了缓解资源问题和环境问题,要引入低碳环保的发展理念,兼顾经济发展和环境保护。对于生产工艺复杂,高污染的生产行业及工程行业,必须通过优化生产工艺,降低生产过程中的污染物排放,才能有效实现生产企业的节能减排,实现生产企业的低碳环保发展。本发明因此而来。
发明内容
针对上述存在的技术问题,本发明的目的是提供一种行业工艺领域知识图谱构建方法及装置,本发明爬取大量互联网开放源数据,基于结构化和半结构化资料,利用资料的结构性,提取行业领域的知识信息,并辅以专家知识和行业调研经验,建立本体库并搭建知识图谱模式层,提高领域概念体系建设效率,并为多行业工艺领域知识图谱建设提供参考,构建的行业工艺领域知识图谱,可以为企业工艺优化升级提供支撑。
本发明的技术方案是:
一种行业工艺领域知识图谱构建方法,包括以下步骤:
S01:获取某行业工艺领域的开放数据源,建立原始资料数据库,所述原始资料数据库划分为结构化、半结构化和非结构化资料;
S02:根据结构化和半结构化资料提取工艺技术知识信息,构建知识图谱数据层;
S03:结合专家知识和行业调研,根据知识图谱数据层的知识信息,建立知识图谱模式层,并建立知识图谱模式层和数据层之间的映射关系;
S04:将构建的知识图谱数据层作为样本库,利用自监督学习方法提取原始资料数据库中非结构化资料中包含的实体、关系及实体属性信息,并依据建立的知识图谱数据层和模式层之间的映射关系,补充知识图谱数据层;
S05:对知识图谱数据层进行知识融合,对知识融合后的数据进行知识推理,得到领域知识图谱。
优选的技术方案中,所述步骤S02中提取工艺技术知识信息包括,从结构化、半结构化资料中,按照字段直接抽取字段名称,以及对应字段中包含的知识单元,并标注工艺领域知识信息的实体、关系以及实体属性,根据结构化和半结构化资料的层级结构将抽取的知识单元按照三元组格式进行存储。
优选的技术方案中,所述步骤S03中建立知识图谱模式层包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华苏州环境创新研究院;清华大学,未经清华苏州环境创新研究院;清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010210748.X/2.html,转载请声明来源钻瓜专利网。