[发明专利]一种基于共生注意力表示学习的服务分类方法有效
申请号: | 202110249579.5 | 申请日: | 2021-03-08 |
公开(公告)号: | CN112836054B | 公开(公告)日: | 2022-07-26 |
发明(设计)人: | 鄢萌;唐斌;吴云松;张小洪;徐玲;任海军;杨丹 | 申请(专利权)人: | 重庆大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06N3/04;G06N3/08 |
代理公司: | 重庆晟轩知识产权代理事务所(普通合伙) 50238 | 代理人: | 王海凤 |
地址: | 400044 *** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 共生 注意力 表示 学习 服务 分类 方法 | ||
本发明涉及一种基于共生注意力表示学习的服务分类方法。具体包括如下步骤:选取一个web服务,该Web服务包括服务描述和服务名称;利用服务描述构建描述服务矩阵;从服务描述中提取信息词,构建服务信息词特征矩阵;利用服务名称构建服务名称特征矩阵;融合信息词特征矩阵和名称特征矩阵获得增强数据特征矩阵;利用增强数据特征矩阵和服务描述特征矩阵建立服务特征相关矩阵;通过计算相关矩阵得到所需的向量参数,最后根据向量参数与特征矩阵得出web服务的服务类别。本发明方法通过提取服务描述作为附加服务特征,将提取出来的信息词与服务名称合并,以形成用于服务分类的服务增强特征,从而提高分类的准确性。
技术领域
本发明涉及服务分类方法领域,特别涉及一种基于共生注意力表示学习的服务分类方法。
背景技术
随着面向服务架构(SOA)的广泛应用,Web服务(例如Mashups)在Web平台和移动应用程序市场上变得越来越流行。到目前为止,已经有了许多有关服务分类的工作,它们中的大多数主要集中于使用关键字来匹配其他服务描述中的关键字来测量不同服务之间的语义距离,分类结果会将具有类似功能的服务分类为同一类别;这些基于关键字的方法主要依赖于服务描述中关键字的质量,而这些关键字是由服务提供商手动指定的,但由于服务提供者对类似功能的服务有不同程度的了解,提供者为服务选择最佳的关键字是比较困难的,这将导致不同提供者之间的语义鸿沟问题,这种鸿沟问题也会限制服务分类的准确性。
为了解决基于选择关键字方法的局限性,许多研究人员提出了各种基于语义的服务分类方法。通常是基于矢量空间模型来学习服务描述概率主题,以测量服务之间的相似性并对服务进行分类。例如,李等人使用潜在狄利克雷分配(LDA)提取服务描述文档的潜在因素以进行服务分类,但基于LDA的分类方法不适用于对简短而稀疏的Web服务描述进行建模。
另一种深度学习模型广泛应用于机器学习研究领域,例如文本分类,服务分类等。研究人员提出了许多深度学习模型,这些模型在捕获各种信息语义,提高分类准确性上具有很出色的性能,代表方法之一就是Kim等人提出的CNN,该方法将CNN与预训练的单词向量集成在一起用以对文本进行分类;另一个是Att-BLSTM,它使用注意力机制进行分类。然而,这些深度学习模型在服务分类方面仍存在一些问题:一是这些模型通常仅从服务描述中提取特征以对Web服务进行分类;二是这些模型无法解决数据稀疏和上下文无关的问题。
为了解决这些问题,杨等人提出了一种用于服务分类的深度神经网络,称为ServeNet-BERT。通过Google BERT(Bidirectional Encoder Representation fromTransformers)模型将服务名称和服务描述嵌入向量空间中,再利用神经网络学习它们的高级特征表示,并将其合并用作Web服务分类。实验结果表明,ServeNet-BERT优于10种机器学习方法,包括LDA-SVM和C-LSTM。尽管ServeNet-BERT在服务分类方面具有优势,但其仍然存在局限性:ServeNet-BERT只是将特征与服务名称和服务描述结合在一起,而没有充分利用服务名称和服务描述之间潜在的语义相关性。
发明内容
针对现有技术存在的上述问题,本发明要解决的技术问题是:充分利用服务名称和服务描述之间潜在的语义相关性,提高服务分类的准确性。
为解决上述技术问题,本发明采用如下技术方案:一种基于共生注意力表示学习的服务分类方法,包括如下步骤:
S100:从公开数据集中选取部分web服务作为训练集,训练集中的每个web服务都有确定的服务类别,对训练集中包含的所有服务类别进行顺序编号;
S200:从该训练集中任选一个Web服务作为训练样本,该训练样本包括服务描述和服务名称;
S300:对每个训练样本从其服务描述中提取服务信息词;
S400:对每个训练样本构建描述特征矩阵D;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆大学,未经重庆大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110249579.5/2.html,转载请声明来源钻瓜专利网。