[发明专利]一种基于知识图谱表示学习的服务聚类方法有效
申请号: | 202010626668.2 | 申请日: | 2020-07-01 |
公开(公告)号: | CN111813955B | 公开(公告)日: | 2021-10-19 |
发明(设计)人: | 姜波;徐学军;任志宏;杨俊琛;王恬;潘伟丰 | 申请(专利权)人: | 浙江工商大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06K9/62 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 刘静 |
地址: | 310018 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 知识 图谱 表示 学习 服务 方法 | ||
1.一种基于知识图谱表示学习的服务聚类方法,其特征在于,包括以下步骤:
(1)获取服务属性,包括服务的category、tag、description;
(2)对服务的description进行自然语言处理,使用Stanford Parser工具进行语法解析获得SD集合;
(3)基于步骤(2)获得的SD集合进行分析并提取出表示服务功能的信息集;
(4)构建服务知识图谱,服务知识图谱中有四种类型的实体结点:api、category、tag、function,其中实体function是步骤(3)提取到的服务功能信息集;
(5)利用知识表示学习的TransH算法将步骤(4)构建的服务知识图谱的实体嵌入到一个低维空间中,通过训练得到低维向量,计算出服务之间的相似值;具体如下:
对服务知识图谱的实体与关系通过Embedding矩阵进行初始化;进行头尾实体映射到超平面wr的向量转化:
‖wr‖2=1
评分函数公式如下:
其中h代表头实体,t代表尾实体,r是实体之间存在的关系;TransH对于每一个关系r,都有一个超平面wr和一个关系向量dr表示;在每一个三元组中,将头实体h和尾实体t都映射到这个超平面上得到向量h⊥和t⊥,训练使h⊥+dr≈t⊥;
对空间中的三元组的实体与关系进行降维,得到实体的低维向量;
实体A,B的相似度计算公式如下:
(6)基于步骤(5)得到的服务实体两两相似度,使用Louvain算法对服务进行聚类,得到聚类结果;具体如下:
将每一个服务实体作为一个节点,两个服务实体之间的相似值作为连边的权重;Louvain算法的模块度Q计算公式如下:
其中m为服务两两相似度的总条数;Ai,j表示服务实体i,j之间的连边权重;ki表示所有指向服务实体i的连边权重之和;Ci是服务实体i的集群号,δ(Ci,Cj)函数表示若服务实体i与j同在一个集群内,则返回值为1,否则返回0;
在利用Louvain算法进行聚类划分过程中,对于每个服务实体i,依次尝试把实体i分配到其每个邻居实体所在的集群C并计算分配前后的模块度增量ΔQ,计算公式为:
其中ki,in表示集群C内实体与服务实体i权重之和;∑tot表示集群C的服务实体相连的边的权重之和;ki代表服务实体i的连边权重之和;
对于任一服务实体i,计算将其并入相邻集群后模块度值的变化ΔQ,将其并入ΔQ值最大的集群,若计算结果为负,则不改变i的归属集群;当所有实体都无法被移动时,说明类别划分在当前已经达到最优状态,算法结束,输出服务聚类结果,具有相似功能语义的服务被聚类到同个类别中。
2.根据权利要求1所述的一种基于知识图谱表示学习的服务聚类方法,其特征在于,知识表示的transH模型通过引入投射到特定关系超平面上的机制,使实体在不同的关系/三元组中扮演不同的角色。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工商大学,未经浙江工商大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010626668.2/1.html,转载请声明来源钻瓜专利网。