[发明专利]一种基于知识图谱表示学习的服务聚类方法有效

专利信息
申请号: 202010626668.2 申请日: 2020-07-01
公开(公告)号: CN111813955B 公开(公告)日: 2021-10-19
发明(设计)人: 姜波;徐学军;任志宏;杨俊琛;王恬;潘伟丰 申请(专利权)人: 浙江工商大学
主分类号: G06F16/36 分类号: G06F16/36;G06K9/62
代理公司: 杭州求是专利事务所有限公司 33200 代理人: 刘静
地址: 310018 浙江*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 知识 图谱 表示 学习 服务 方法
【权利要求书】:

1.一种基于知识图谱表示学习的服务聚类方法,其特征在于,包括以下步骤:

(1)获取服务属性,包括服务的category、tag、description;

(2)对服务的description进行自然语言处理,使用Stanford Parser工具进行语法解析获得SD集合;

(3)基于步骤(2)获得的SD集合进行分析并提取出表示服务功能的信息集;

(4)构建服务知识图谱,服务知识图谱中有四种类型的实体结点:api、category、tag、function,其中实体function是步骤(3)提取到的服务功能信息集;

(5)利用知识表示学习的TransH算法将步骤(4)构建的服务知识图谱的实体嵌入到一个低维空间中,通过训练得到低维向量,计算出服务之间的相似值;具体如下:

对服务知识图谱的实体与关系通过Embedding矩阵进行初始化;进行头尾实体映射到超平面wr的向量转化:

‖wr2=1

评分函数公式如下:

其中h代表头实体,t代表尾实体,r是实体之间存在的关系;TransH对于每一个关系r,都有一个超平面wr和一个关系向量dr表示;在每一个三元组中,将头实体h和尾实体t都映射到这个超平面上得到向量h⊥和t⊥,训练使h⊥+dr≈t⊥;

对空间中的三元组的实体与关系进行降维,得到实体的低维向量;

实体A,B的相似度计算公式如下:

(6)基于步骤(5)得到的服务实体两两相似度,使用Louvain算法对服务进行聚类,得到聚类结果;具体如下:

将每一个服务实体作为一个节点,两个服务实体之间的相似值作为连边的权重;Louvain算法的模块度Q计算公式如下:

其中m为服务两两相似度的总条数;Ai,j表示服务实体i,j之间的连边权重;ki表示所有指向服务实体i的连边权重之和;Ci是服务实体i的集群号,δ(Ci,Cj)函数表示若服务实体i与j同在一个集群内,则返回值为1,否则返回0;

在利用Louvain算法进行聚类划分过程中,对于每个服务实体i,依次尝试把实体i分配到其每个邻居实体所在的集群C并计算分配前后的模块度增量ΔQ,计算公式为:

其中ki,in表示集群C内实体与服务实体i权重之和;∑tot表示集群C的服务实体相连的边的权重之和;ki代表服务实体i的连边权重之和;

对于任一服务实体i,计算将其并入相邻集群后模块度值的变化ΔQ,将其并入ΔQ值最大的集群,若计算结果为负,则不改变i的归属集群;当所有实体都无法被移动时,说明类别划分在当前已经达到最优状态,算法结束,输出服务聚类结果,具有相似功能语义的服务被聚类到同个类别中。

2.根据权利要求1所述的一种基于知识图谱表示学习的服务聚类方法,其特征在于,知识表示的transH模型通过引入投射到特定关系超平面上的机制,使实体在不同的关系/三元组中扮演不同的角色。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工商大学,未经浙江工商大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010626668.2/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top