[发明专利]一种基于语义Web服务聚类的服务集特征量提取方法有效

申请号：	201310314177.4	申请日：	2013-07-24
公开（公告）号：	CN103399897A	公开（公告）日：	2013-11-20
发明（设计）人：	刘发贵;彭晨漪	申请（专利权）人：	华南理工大学
主分类号：	G06F17/30	分类号：	G06F17/30;H04L29/08
代理公司：	广州粤高专利商标代理有限公司 44102	代理人：	何淑珍
地址：	511458 广东省广州市***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于语义 web 服务特征提取方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明属于智能语义网中，语义Web服务特征提取领域，具体涉及在聚类所获得的语义Web服务集的基础上提出的一种语义Web服务集特征量提取方法。

背景技术

随着语义Web服务蓬勃发展，一系列的问题也接踵而来。通常进行Web服务发现的过程是通过UDDI注册中心注册服务的形式，让UDDI为用户提供一个统一的服务发现机制。在判定一个服务是否能够满足请求时,要求服务注册库中的所有服务都逐一地与服务请求进行匹配比较。然而，当服务库中有成千上万条记录时,很多时间会被花费在匹配比较一些毫不相关Web服务上。与此同时，服务提供商在因特网上发布的服务更加趋于领域化和专业化，不同领域的服务之间存在明显的功能差别。如果将它们放在统一的UDDI服务注册中心，会在服务发现的过程中，耗费过多的时间在众多无关服务中搜索。由此，大量的语义Web服务使得查找某些特定服务的搜索范围逐渐扩大，所耗费的时间增多，从而降低了服务发现的效率。为了解决这一问题，为众多的语义web服务进行聚类处理成为了新的关注焦点。通过对服务注册中心的语义web服务进行聚类，将大量的服务划分成独立的服务集，并以单个服务集作为某次服务发现的服务注册中心。这样缩小了服务发现过程中服务搜索的范围，减少了匹配不相关Web服务的数量，起到了提高服务发现效率的作用。

但新的问题是，经过聚类获得多个语义Web服务集后，如何通过一定的方法，在服务发现的过程中，为用户自动选择与请求最为匹配的服务集作为服务发现的注册中心使得用户可最高效率的获得最为满意的语义web服务，而不是多个服务集中随机选择或者人工选择合适的服务集。要解决这个问题，涉及到两个方面的技术。一方面，如何挖掘出服务集中服务的共有特征，并将该共有特征作为区分各服务集的特征量；另一方面，如何在服务发现的过程中，利用服务集的特征量来进行服务集，也就是服务注册中心的选择。本发明解决了第一个技术问题，提出了一种语义Web服务集特征量，以及这种语义Web服务集特征量的提取方法。

特征量，顾名思义，特征的量化表示。特征是一群客体所共有的特性形成的某一概念。而特征量则是将这一概念数据化，用一定的数据结构或者数值表示出来，使得特征量之间可通过一定的算法进行比较。而服务集的特征量，指的是该集合中所有语义web服务的共有特征。

目前常用的一种特征量静态获取技术是为已聚类的集合人为的贴上标签。标签获取的方法主要是利用现有的层次目录，如LookSmart’s Web Directory，来选择合适于各集合的标签，也就是特征量。这种方法虽然拥有一定的理论基础和层次逻辑，但是当有大量新的服务需要注册分类到服务注册中心时，这种静态获取技术无法根据新服务的特征，对相应服务集的特征量进行适当的调整和更新，不利于服务集的扩展与更新。

除此之外，另一种特征量动态获取的技术，是采用bigram也就是二元模型来进行特征量提取。具体的来说，就是从集合的元素属性（属性之间相互独立）中，取出一对属性来充当该类集的特征量。二元模型中的两个属性总是同时出现，例如，姓名与年龄属性在某个集合中总是同时出现，且同时出现的频率明显高于其他属性的出现频率，则把(姓名，年龄)属性对作为该集合的特征量。这种特征量获取的技术可以扩展到n元模型中。若集合存在属性x₁,x₂,x₃,……x_n，且属性间相互独立。然而很多时候，二元模型不足以将各服务集区分开来，而多元模型又可能因为维数过多而导致在利用特征量进行服务匹配时，效率低下。

发明内容

本发明的目的在于克服现有特征量提取技术的不足，用树结构构建了语义Web服务集特征量，并提供了一种语义Web服务集特征量提取的方法。

为了实现上述发明目的，采用的技术方案如下：

本发明所构建的服务集特征量以本体特征树的形式来表示。特征量有两种可能的状态。一种状态是特征量为输入本体和输出本体共同构建的本体特征树；另一种状态下特征量为两棵本体特征树的集合，这两棵本体特征树分别由输入本体和输出本体构建而成。

一种基于语义Web服务聚类的服务集特征量提取方法，包括如下三个步骤：

1）对服务集进行本体统计，得到服务集本体特征集；

2）按照本体出现次数从大到小的规则，对本体特征集进行排序；

3）根据步骤2）所得排序后的服务集本体特征集，构建相应服务集的本体特征树，并据此生成特征量；

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于华南理工大学，未经华南理工大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201310314177.4/2.html，转载请声明来源钻瓜专利网。