[发明专利]一种Web服务相似度的计算方法无效
申请号: | 201310394586.X | 申请日: | 2013-09-03 |
公开(公告)号: | CN103455598A | 公开(公告)日: | 2013-12-18 |
发明(设计)人: | 刘方方;王蕾;张高唯 | 申请(专利权)人: | 上海大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 上海上大专利事务所(普通合伙) 31205 | 代理人: | 何文欣 |
地址: | 200444*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种Web服务相似度的计算方法。它是一种改进最大二分匹配的两阶段服务相似度计算方法。它将Web服务所含的关键词作为整体,考虑到了关键词之间的关联对Web服务相似度的影响,因而能够更加有效的区分Web服务之间的相似程度,提高相似度计算的精度,其步骤是根据词网或搜索引擎计算两个Web服务中关键词之间的距离;利用最大二分匹配算法找到未被匹配的关键词;由于未被匹配的关键词也是Web服务的一部分,而且与其它已经匹配的关键词之间存在内在联系,因此利用改进的最大二分匹配的两阶段服务相似度计算方法可以得到更加精确的结果。 | ||
搜索关键词: | 一种 web 服务 相似 计算方法 | ||
【主权项】:
1.一种Web服务相似度的计算方法,是一种两阶段法计算Web服务的相似度,对二分图法进行了改进,具体操作步骤如下:(1) 从需要比较的两个Web服务的描述文档WSDL中提取关键词,关键词为名词和形容词;(2) 计算两个Web服务的每一对关键词之间的距离:利用词网Wordnet直接得到,或利用搜索引擎谷歌计算得到;(3) 首先使用二分图法,将两个Web服务所含的关键词看作图中的点,两个Web服务是两个不相交的点集,每对关键词之间的距离作为点之间的带权边,权值即为距离值,计算二分图的最大二分匹配值,计算公式如下:
其中,
表示最大二分匹配值,
表示所含关键词的集合,
与
分别表示两个Web服务所含的关键词,
为两个服务的关键词之间的距离值;(4) 最大二分匹配是两个Web服务构成的二分图的子集,两个Web服务在最大二分匹配中含有相同个数的关键词,当两个Web服务的关键词个数不等时,最大二分匹配不能包含两个服务的所有关键词,关键词个数较多的服务存在剩余关键词; (5) 计算剩余的服务关键词与其他关键词距离最大值之和,与最大二分匹配值合并,并进行归一化处理,得到两个网络服务的相似度,计算公式如下:
其中,
表示两个服务的相似度值,
分别表示两个Web服务的关键词个数,假定
,
表示关键词个数较多的服务未包含在最大二分匹配内的剩余关键词集合。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海大学,未经上海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310394586.X/,转载请声明来源钻瓜专利网。