[发明专利]一种基于知识图谱表示学习的服务聚类方法有效
申请号: | 202010626668.2 | 申请日: | 2020-07-01 |
公开(公告)号: | CN111813955B | 公开(公告)日: | 2021-10-19 |
发明(设计)人: | 姜波;徐学军;任志宏;杨俊琛;王恬;潘伟丰 | 申请(专利权)人: | 浙江工商大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06K9/62 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 刘静 |
地址: | 310018 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 知识 图谱 表示 学习 服务 方法 | ||
本发明公开了一种基于知识图谱表示学习的服务聚类方法,包括以下步骤:获取服务属性,包括服务的category、tag、description,使用自然语言工具对description进行处理,获得服务功能信息集;构建服务知识图谱,利用知识表示学习的TransH算法将服务知识图谱的实体嵌入到一个低维空间中,通过训练得到低维向量,计算出服务之间的相似值;使用Louvain算法对服务进行聚类,得到聚类结果。本发明从服务之间的关系通过知识图谱来描述的角度出发,采用知识表示算法将服务实体嵌入到低维空间进行距离计算,将知识图谱与服务计算领域相结合,突破了服务之间的语义关联问题,更为准确地按需服务发现提供技术支持。
技术领域
本发明涉及服务计算领域,尤其涉及一种基于知识图谱表示学习的服务聚类方法。
背景技术
面向服务的架构(SOA)是一个架构思想,根据项目服务完成架构搭建,以服务为基准点完成组件化和模块化。SOA的提出就是要将紧耦合的系统,划分为面向业务的,粗粒度,松耦合,无状态的服务。服务发布出来供其他服务调用,一组互相依赖的服务就构成了SOA架构下的系统。现如今,随着internet技术、服务计算(SOC)、大数据等技术的快速发展,以及需求的不断变化,Web服务数量呈爆发式增长。目前,已进入Web服务的大数据时代,Web服务的类型丰富,无论是基于简单对象访问协议(SOAP)的传统服务,还是目前较流行的RESTful风格的服务,Web服务都为个人用户和企业带来了巨大的便利,同时,服务之间的竞争合作,又带动了整个社会的创新。但随着Web服务的数量、种类与规模的不断增长,各平台中具有相似属性描述但功能差异的Web服务不计其数,往往给用户造成了选择障碍。如何高效、准确地发现满足用户需求成为了SOC研究领域一直经久不衰的研究热点。目前,基于传统关键字匹配方法、基于情境的服务发现方法、基于Web语义的服务发现方法,在服务数量剧增的今天,不能很好的满足用户需求。为此,如何提升Web服务发现效率和准确性,更好的满足用户需求,节省用户的搜索时间引起了国内外研究学者的兴趣。
知识图谱本质上是一个以图结构为基础,揭示实体之间关系的大型语义网络。其目的是为了提升搜索引擎返回的答案质量和用户的查询效率。知识图谱的数据存储通常是以实体—关系—属性这种三元组的形式存储信息,三元组可以更好的描述出实体与实体之间的关系,并且将知识以图的形式呈现:每一个结点代表真实世界中的某一实体,而不同的边表示每个结点中的不同关系,从而实现知识描述的作用。知识图谱的概念一经提出就引起业内广泛的关注,它的应用场景非常广,主要在语义数据集成、语义搜索、智能问答、数据分析、智能推荐领域占据重要的地位。
服务聚类在服务发现、服务推荐领域中,是一门关键技术,通过聚类相似服务,可以在极大程度上减少服务搜索的次数,同时缩小了搜索的服务范围,提高服务发现的效率。目前已经有很多学者研究这方面工作,例如从WSDL文档上挖掘文本特征,运用特征工程的相关技术,选取出能够体现服务功能的特征,将其转化为向量,通过相似度计算公式,计算服务之间的相似度,并聚类成簇。又如采用自底向上的聚类算法,将功能相似度的服务聚集到一起。但是现有工作仍存在以下两点不足:
1)基于内容的服务聚类对承载内容的描述文档有一定要求,并且一般方法仅针对单一类型的文档起作用,并不能对多种类型的文档作用。
2)较少考虑大规模的语义网络,现实世界中服务并非独立存在,它们之间通常具有某种关联关系并以某种方式相互影响(如共享标签的关系等),这些服务间的语义关系鲜有被充分利用到。
因此,针对现有的服务聚类方法中存在的不足,如何利用机器学习,自然语言处理的技术,让大规模的语义网构建成为可能,从实用性的角度出发,更高效、准确的服务聚类成为了一个具有挑战性的问题。
发明内容
本发明针对现有技术的不足,提供一种基于知识图谱表示学习的服务聚类方法。
本发明的目的是通过以下技术方案来实现的:一种基于知识图谱表示学习的服务聚类方法,包括以下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工商大学,未经浙江工商大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010626668.2/2.html,转载请声明来源钻瓜专利网。