[发明专利]一种基于标准知识图谱的标准文档冲突检测方法及系统有效
申请号: | 202110732648.8 | 申请日: | 2021-06-29 |
公开(公告)号: | CN113449118B | 公开(公告)日: | 2022-09-20 |
发明(设计)人: | 蔡毅;曹晋;吴欣 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06K9/62 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 何淑珍;江裕强 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 标准 知识 图谱 文档 冲突 检测 方法 系统 | ||
本发明公开了一种基于标准知识图谱的标准文档冲突检测方法及系统,所述方法首先对标准文档的非结构化文本内容进行结构化抽取,形成标准知识图谱。基于该标准知识图谱,通过文本相似度匹配,多实体列表匹配等技术找出若干标准知识图谱间的冲突实体,实现标准文档间的冲突检测。所述方法具有良好的标准文档冲突检测能力,在给定若干标准文档下,能够对各个标准文档中的知识进行结构化,形成若干标准知识图谱,并通过标准知识图谱实现标准文档冲突检测,可广泛应用于标准编写领域。
技术领域
本发明涉及自然语言处理、知识图谱构建、文本匹配领域,具体涉及一种基于标准知识图谱的标准文档冲突检测方法及系统。
背景技术
随着我国标准化进程的推进,各行各业已经沉淀了许多标准文档,为我国的进一步科技创新打下了坚实的基础。然而,现阶段的标准数据大都以文本、图片的形式存储在数据库中,其中的海量知识尚未得到充分利用。
各行各业均表现出对标准数据实现自动化知识挖掘的需求,以辅助标准从业人员、企业、科研人员等社会各界更好地利用标准知识,从而进一步地推动各行各业的科技创新。现有的标准大多以数据的形式存储,如何推动现有的标准数据从“数据”向“知识”过渡,核心需求在于通过数据观察与感知世界,实现分类预测、自动化等智能化服务。以医疗防护用品领域为例。各种医疗防护用品的标准是指导企业复工复产的重要依据。标准的制定及生成产品对标属于产业基础性共性技术,然而当前我国各行业存在标准制定周期长、效率低,以及产品对标依赖人工、耗时长且易遗漏出错等问题。相关从业人员人工构建了标准知识图谱以帮助生产企业、医护人员、社会公众实现便捷查询,对相关标准内容进行研究、比较、学习、运用,加快了企业的复工复产,助力经济恢复。
标准制定者在进行标准写作时,常常将大量时间花费在规范标准术语等过程上,效率有待提升。现阶段缺少一种标准冲突检测工具,帮助标准制定者快速定位标准文档间的冲突,加速标准的制定。
发明内容
本发明目的在于提出一种基于标准知识图谱的标准文档冲突检测方法,所述方法首先对标准文档的非结构化文本内容进行结构化抽取,形成标准知识图谱。基于该标准知识图谱,通过文本相似度匹配,多实体列表匹配等技术找出若干标准知识图谱间的冲突实体,实现标准文档间的冲突检测。所述方法具有良好的标准文档冲突检测能力,在给定若干标准文档下,能够对各个标准文档中的知识进行结构化,形成若干标准知识图谱,并通过标准知识图谱实现标准文档冲突检测,可广泛应用于标准编写领域。
至少通过如下技术方案之一实现。
一种基于标准知识图谱的标准文档冲突检测方法,所述方法包括以下步骤:
1)、从标准文档D中抽取若干实体、属性及其关系,构建成相对应的标准知识图谱,知识图谱包括若干条三元组,每一个三元组包含头实体、关系和尾实体三个元素;
2)、对于构建好的两个标准知识图谱的三元组进行分类,分为唯一尾实体三元组和多尾实体三元组;
3)、对于所述两个标准知识图谱中具有相同头实体和关系的唯一尾实体三元组,对比相同头实体的唯一关系三元组的尾实体间的相似度;
4)、对于所述两个标准知识图谱中具有相同头实体和关系的多尾实体三元组,匹配两个多尾实体三元组间描述相近的尾实体,对具有相同头实体的多尾实体三元组列表中的所有三元组依次计算相似度,并取列表匹配度最高的匹配作为匹配结果;
5)、根据两种三元组的相似度匹配结果输出两个文档的冲突检测结果。
优选的,所述唯一尾实体三元组指的是对于一头实体和某一关系只存在唯一相对应的尾实体。
优选的,所述多尾实体三元组指的是对于某一头实体和某一个关系存在多个尾实体,即该标准文档中,存在多条具有相同头实体和关系的三元组。
优选的,所述步骤3)包括以下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110732648.8/2.html,转载请声明来源钻瓜专利网。