[发明专利]一种基于标准知识图谱的标准文档冲突检测方法及系统有效
申请号: | 202110732648.8 | 申请日: | 2021-06-29 |
公开(公告)号: | CN113449118B | 公开(公告)日: | 2022-09-20 |
发明(设计)人: | 蔡毅;曹晋;吴欣 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06K9/62 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 何淑珍;江裕强 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 标准 知识 图谱 文档 冲突 检测 方法 系统 | ||
1.一种基于标准知识图谱的标准文档冲突检测方法,其特征在于,所述方法包括以下步骤:
1)、对于标准文档D,通过命名实体识别、关系抽取从D中抽取若干实体、属性及其关系,构建成相对应的标准知识图谱GD,知识图谱由若干条三元组构成,每一个三元组包含头实体、关系和尾实体三个元素;
2)、对于两个构建好的标准知识图谱和对其中的三元组进行分类,分为唯一尾实体三元组和多尾实体三元组,具体包括:
2.1)、唯一尾实体三元组即对于某一头实体和某一关系只存在唯一相对应的尾实体;
2.2)、多尾实体三元组即对于某一头实体和某一关系存在多个尾实体,即该标准文档中,存在多条具有相同头实体和关系的三元组;
3)、对于和中具有相同头实体和关系的唯一尾实体三元组,采用Ratcliff-Obershelp文本相似度算法对比相同头实体的唯一关系三元组的尾实体间的相似度,具体包括:
3.1)、假设两个标准知识图谱和中,存在唯一尾实体三元组T1和T2,T1和T2具有相同头实体和关系,T1和T2的头实体和关系均为H和R,尾实体分别为和
3.2)、通过Ratcliff-Obershelp相似度算法计算和之间的相似度,若相似度为1,则说明和完全一样,不存在冲突;若和之间相似度小于1,那则两个实体不相同,存在冲突,且相似度越小,冲突程度越大;
4)、对于和中具有相同头实体和关系的多尾实体三元组,采用最大列表匹配算法,对具有相同头实体的多关系三元组列表中的所有三元组采用Ratcliff-Obershelp文本相似度算法依次计算相似度,并取列表匹配度最高的匹配作为匹配结果;
4.1)、假设两个标准知识图谱和中,存在若干多尾实体三元组,若干多尾实体三元组具有相同头实体和关系,其头实体和关系均为H和R,尾实体列表分别为即中有m个与H和R关联的尾实体,即中有n个与H和R关联的尾实体;
4.2)、对于每一个在W1中的实体Wi1,1≤i≤m,通过Ratcliff-Obershelp相似度算法计算Wi1和W2中所有实体Wj2,1≤j≤n的相似度,得到两个列表的相似度矩阵S∈Ri×j,i、j表示在某个范围内任取一个,R表示实数集;
4.3)、对于两个尾实体列表,需要找到两两匹配;通过遍历所有可能的两两组合,根据相似度矩阵S计算出该组合的相似度总和,遍历完成后,得到两个列表相似度最高时的匹配组合,若该匹配组合中所有匹配的相似度均为1,则这两个尾实体列表无冲突;如果存在匹配相似度小于1,那么存在不相同的尾实体,存在冲突,且相似度越小,冲突程度越大;
根据两种三元组的相似度匹配结果输出最终两个文档D1和D2间的冲突检测结果;输出的冲突检测结果是通过相似度得到的:相似度小于1,那么这两个实体不相同,存在冲突,且相似度越小,冲突程度越大。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110732648.8/1.html,转载请声明来源钻瓜专利网。