[发明专利]用于概念聚类的设备和计算机实现的方法在审
申请号: | 202111149973.8 | 申请日: | 2021-09-29 |
公开(公告)号: | CN114328810A | 公开(公告)日: | 2022-04-12 |
发明(设计)人: | D·斯捷潘诺娃;E·列文科夫;M·加德-埃尔拉布;T·K·陈 | 申请(专利权)人: | 罗伯特·博世有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/35;G06F16/36;G06F40/194;G06F40/30 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 任一方;吕传奇 |
地址: | 德国斯*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 概念 设备 计算机 实现 方法 | ||
用于概念聚类的设备和计算机实现的方法。设备和计算机实现的方法,该方法包括:确定(1)第一实体(204)的嵌入(206)、特别是知识图(202)的嵌入(206),在特别是加权的、特别是无向图(208)中插入(2)用于嵌入(206)的第一顶点(210),在图(208)中确定(3)包括第一顶点(210)的顶点的第一聚类(216),为第一聚类(216)确定(4)第二实体(226),特别是在知识图(202)中,确定(4)第一实体(204)与第二实体(222)之间的语义相似度(224),特别是在知识图(202)中,取决于第一实体(204)与第二实体(222)之间的语义相似度(224)来确定(5)第一聚类(216)的规则(226)。
背景技术
本发明涉及概念聚类。
例如在R. E. Stepp和R. S. Michalski.的“Conceptual clustering ofstructured objects: A goal-oriented approach”(人工智能,28(1):43–69(1986))中描述了概念聚类在关系数据上的任务。
发明内容
本发明提供了一种用于解决关系数据上的概念聚类问题的计算机实现的方法、对应的设备和对应的计算机程序。
该计算机实现的方法包括:确定第一实体的嵌入,特别是知识图的嵌入,在特别是加权的、特别是无向图中插入用于嵌入的第一顶点,在图中确定包括第一顶点的顶点的第一聚类,为第一聚类确定第二实体,特别是在知识图中,确定第一实体与第二实体之间的语义相似度,特别是在知识图中,取决于第一实体与第二实体之间的语义相似度来确定第一聚类的规则。这样,概念聚类任务在知识图KG的实体上执行,其中给定目标实体的集合和KG,目标是基于在KG上为这些组计算的描述的质量,将这些实体聚类到特别是未知数量的不同组中。该规则为计算的聚类提供了对于人类和机器一样可理解的描述。该方法具有计算高质量聚类连同其描述的能力,而无需先验知道它们的数量。此外,与不需要聚类的数量作为输入的其他现有聚类方法(例如,DBSCAN)形成对比,该方法由于要调谐的超参数的数量小而尤其吸引人。
在图中插入第一顶点可以包括利用标签来标记将图的第一顶点链接到第二顶点的图的边。依赖于目标实体,构造了特别是无向完全加权图,其中每对实体之间的边被标记。
对边进行标记可以包括取决于第一顶点的第一向量与第二顶点的第二向量之间的距离来确定权重,并且利用函数将权重映射到标签。使用例如嵌入空间中相应实体之间的余弦相似度来标记每对实体之间的边。
确定第一聚类可以包括确定包括第一顶点的第一聚类的图的边的子集,使得图中没有循环与该子集相交一次。多切割(multicut)问题基于该图被制定并且得到了有效解决。
确定嵌入可以包括利用模型将第一实体映射到向量空间中的第一向量。该模型可以是嵌入模型,其将KG的实体和关系转换成向量空间中的向量,特别是低维向量空间中的向量。
确定规则可以包括取决于与第二实体的语义相似度来确定多个规则,并且从多个规则选择规则。
选择规则可以包括确定规则所覆盖的属于第一聚类的实体的数量,确定规则所覆盖的属于第二聚类的实体的数量,取决于规则所覆盖的属于第一聚类的实体的数量并且取决于属于第二聚类的实体的数量来确定规则的度量,以及如果度量满足条件则选择该规则,或否则不选择该规则。
确定度量可以包括确定规则所覆盖的属于第一聚类的实体的数量与第一聚类的基数的比率。
确定度量可以包括确定规则所覆盖的属于第二聚类的实体的数量与第二聚类的基数的比率。
该方法可以包括取决于规则来确定输出,检测规则的输入,以及取决于输入来确定规则的标签。该规则描述了KG中发现的概念。可以向专家提供这样的描述,并且为其建议名称。这样的概念可以然后以建议的名称被添加到KG。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于罗伯特·博世有限公司,未经罗伯特·博世有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111149973.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于带电粒子系统中样品的3D图像的深度重建
- 下一篇:假体瓣膜递送系统