[发明专利]一种材料领域知识图谱的实体标签聚类方法及装置在审
申请号: | 202111258392.8 | 申请日: | 2021-10-27 |
公开(公告)号: | CN114090784A | 公开(公告)日: | 2022-02-25 |
发明(设计)人: | 付冬梅;宋广轩 | 申请(专利权)人: | 北京科技大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06K9/62 |
代理公司: | 北京市广友专利事务所有限责任公司 11237 | 代理人: | 张仲波 |
地址: | 100083*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 材料 领域 知识 图谱 实体 标签 方法 装置 | ||
1.一种材料领域知识图谱的实体标签聚类方法,其特征在于,包括:
S1:获取三元组形式的材料领域知识图谱;统计知识图谱中的节点实体、节点实体集合以及节点实体的关系信息;
S2:基于所述节点实体集合创建标签分类树根结点;
S3:基于谓词逻辑,遍历所有所述节点实体,将所述节点实体插入所述标签分类树,并记录支持交集结点存在的节点实体数量为证据数量;
S4:根据所述证据数量的阈值,将所述标签分类树拆分成标签分类子树;得到所述标签分类子树中根结点所记录的入边关系集合和出边关系集合;
S5:根据所述标签分类子树中根结点所记录的所述入边关系集合和出边关系集合,将每个所述节点实体归入所述标签分类子树代表的标签类别中,得到节点实体类别标签,完成材料领域知识图谱的实体标签聚类。
2.根据权利要求1所述的材料领域知识图谱的实体标签聚类方法,其特征在于,所述步骤S1中,获取三元组形式的材料领域知识图谱;得到知识图谱中的节点实体、节点实体集合以及节点实体的关系信息,包括:
S11:若材料领域知识图谱是以三元组数据模型存储,则将三元组数据模型加载进入系统内存;若否,则先将所述材料领域知识图谱转化为三元组形式,再加载进入系统内存;
S12:遍历所述三元组,将所述三元组中的头实体和尾实体作为节点实体,添加至节点实体集合;
S13:根据添加的所述节点实体在所述三元组中的位置和所述三元组中包含的关系,确定所述关系与所述节点实体的进出关系;将所述关系添加至所述节点实体集合中,记作对应节点实体的入边关系或出边关系记录。
3.根据权利要求2所述的材料领域知识图谱的实体标签聚类方法,其特征在于,所述步骤S2中,基于所述节点实体集合创建标签分类树根结点,包括:
初始化所述标签分类树,创建标签分类树根结点。
4.根据权利要求3所述的材料领域知识图谱的实体标签聚类方法,其特征在于,所述步骤S3中,基于谓词逻辑,遍历所有所述节点实体,将所述节点实体插入所述标签分类树,并记录支持交集结点存在的节点实体数量为证据数量,包括:
S31:取所述节点实体集合中的一个节点实体,插入所述标签分类树根结点;
S32:取所述节点实体集合中另一个未添加至标签分类树中的新节点实体,以广度优先方式搜索所述标签分类树,根据谓词逻辑判断检索结点与所述节点实体的入边关系和出边关系记录存在交集的情况,并根据谓词逻辑将所述节点实体插入标签分类树的特定位置,记录检索结点证据数量;
S33:当对所述标签分类树搜索完成后未能插入新节点实体时,将新节点实体插入至所述标签分类树根结点;
S34:重复步骤S32-S33,直至完成对所述节点实体集合的遍历。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京科技大学,未经北京科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111258392.8/1.html,转载请声明来源钻瓜专利网。