[发明专利]异构图注意力网络增强的Web服务分类方法有效
申请号: | 202110853763.0 | 申请日: | 2021-07-28 |
公开(公告)号: | CN113554100B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 曹步清;彭咪 | 申请(专利权)人: | 湖南科技大学 |
主分类号: | G06F18/214 | 分类号: | G06F18/214;G06F18/22;G06F17/16;G06N3/0464 |
代理公司: | 深圳国联专利代理事务所(特殊普通合伙) 44465 | 代理人: | 施得运 |
地址: | 411201 湖南省湘潭市雨*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 构图 注意力 网络 增强 web 服务 分类 方法 | ||
1.异构图注意力网络增强的Web服务分类方法,其特征在于,包括如下步骤:
1)构造基于元路径的服务相似度矩阵:针对每条元路径采用Pathsim计算服务之间的相似性;给定一个对称的元路径P,S(Ai,Aj)通过两个方面来定义:两个服务Ai和Aj定义在元路径上的联系以及它们与自身的路径实例个数;因此,两个服务Ai和Aj的Pathsim值如公式(1)所示:
其中,是服务Ai和Aj之间的路径实例,当元路径的中间节点数超过1个时,采用交互矩阵将路径中不同关系矩阵进行连接,如公式(2)所示:
其中,为通过服务与其他类型节点之间的关系Ri得到的关系矩阵,Mij为服务Ai和Aj在特定关系下交互矩阵中对应的值;从而服务Ai和Aj的Pathsim值演变为了服务交换矩阵中的值的计算,如公式(3)所示:
计算出每条元路径下两两服务之间的相似度后,通过设置超参数确定相似度阈值;并将相似度超过阈值的服务确定为邻居服务,并对其应用onehot编码,每一个邻接矩阵代表一个基于元路径引导的邻域;
2)节点级别注意力:针对每条元路径产生邻接矩阵,设计节点级注意力的计算,其输入是服务的特征向量,输出为不同元路径下服务的表征向量;首先用线性层对输入的特征向量进行特征增强,如公式(4)所示,
f′=WLf (4)
其中,WL为线性层随机初始化的参数矩阵,F为服务的原始特征矩阵,F={f1,f2,...,fN};F′为服务的线性转换特征矩阵,F′={f1′,f2′,...,fN′};根据不同元路径得到的邻接矩阵,计算特定元路径下Ai对服务Aj的注意力权重;给定一个通过元路径连接的服务节点对(Ai,Aj),所有基于元路径的节点对共享参数向量α;公式(5)中节点对的权重取决于服务本身的特征;同时,计算得到的注意力结果是不对称的,即服务Ai对服务Aj的重要性和服务Aj对服务Ai的重要性不一定相同;
其中,f′i是经过一层线性变换得到的增强特征,为元路径p下节点级注意力层共享参数向量,该参数由一层前馈神经网络进行训练得到;||表示串联操作;σ为非线性激活函数,采用LeakyReLU;最后应用softmax进行归一化得到的为元路径p下邻居服务Aj对服务Ai的注意力系数;将每条元路径下的所有邻居节点的注意力权重与特征进行加权求和得到最终基于元路径的节点表征;如公式(6)所示,每个服务节点嵌入由它的邻居服务聚集,由于节点级别注意权重是在单个元路径下得到的,因此具有该条元路径所附带的语义特异性;
其中,为元路径p下服务Ai的邻居服务集合,为服务Aj在元路径p下节点级嵌入表征;重复若干次上述计算得到服务在单个元路径下的多个表征,然后利用级联聚合K次计算得到的表征;如公式(7)所示:
最终,对于整个数据集,将元路径p下节点级别得到的最终服务节点嵌入矩阵表示为:Φp={e′1,e′2,...,e′N,};
3)元路径级别注意力:通过节点级的计算,得到了服务在各条元路径下的表征矩阵{ΦATA,ΦAMAMA,ΦADA,ΦAWA};首先,对每个节点级表征结果使用一层MLP做非线性变换;针对变换后的嵌入向量,将元路径级别注意力度量为变换后的节点级嵌入向量与注意力参数向量的相似性;如公式(8)所示:
其中,θT为语义级注意向量,Wmet表示MLP层的参数矩阵,b表示一个偏置向量,所有参数对于每次的注意力计算都是共享的;V是所有的服务节点,是服务Ai在第p条元路径下的注意力权重;在得到每个元路径的重要性之后,通过softmax函数对它们进行规范化;将学习到的权重作为系数,融合节点级计算得到的服务嵌入,得到最终的嵌入结果;如公式(9)所示:
其中,为元路径p下服务Ai经过节点级注意力计算后的节点表征;Zi则为聚合了各条元路径表征的结果;
4)服务类别预测:将最终的服务嵌入输入到一个全连接层,利用softmax激活函数输出所有候选的Web服务类别的概率分布;Softmax将多分类的输出数值转化为相对概率,其计算如公式(10)所示:
最后,对于半监督节点分类,最小化所有服务节点在真实标签和预测标签之间的交叉熵来计算损失值;如公式(11)所示:
其中,β是分类器的参数,yC是具有标签的节点索引集,Yl和Zl是标记节点的标签和嵌入;在标记数据的指导下,通过反向传播优化模型,学习节点的嵌入情况。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南科技大学,未经湖南科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110853763.0/1.html,转载请声明来源钻瓜专利网。