[发明专利]一种结合注意力机制LSTM和神经主题模型的服务发现方法有效
申请号: | 202010483308.1 | 申请日: | 2020-06-01 |
公开(公告)号: | CN111797196B | 公开(公告)日: | 2021-11-02 |
发明(设计)人: | 李兵;姚力;王健 | 申请(专利权)人: | 武汉大学 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F40/289;G06F40/30;G06N3/04;G06N3/08 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 罗飞 |
地址: | 430072 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 结合 注意力 机制 lstm 神经 主题 模型 服务 发现 方法 | ||
1.一种基于注意力机制的LSTM和神经主题模型相结合的服务发现方法,其特征在于,包括:
S1:分别对Web服务描述和查询请求进行关键词抽取,对抽取出的服务描述关键词和查询请求关键词进行预处理;
S2:对预处理后的服务描述关键词进行语义增强并经过神经主题模型的处理得到服务描述的主题信息,对预处理后的查询请求关键词进行语义增强并经过神经主题模型的处理得到查询请求的主题信息;
S3:通过词嵌入技术将预处理后的服务描述关键词和查询请求关键词转化为向量化形式,并得到服务描述的词向量矩阵和查询请求的词向量矩阵;
S4:基于服务描述的主题信息和服务描述的词向量矩阵,通过结合注意力机制的双向LSTM对服务描述进行特征提取,得到服务描述的语义特征向量,基于查询请求的主题信息和查询请求的词向量矩阵,通过结合注意力机制的双向LSTM对查询请求进行特征提取,得到查询请求的语义特征向量;
S5:对查询请求的语义特征向量和服务描述的语义特征向量计算相似度,从注册服务库中找出与查询请求相似度最高的k个服务,其中,k为大于0的正整数;
其中,S2具体包括:
S2.1:从预设百科类网站中查询与抽取出的服务描述关键词、查询请求关键词对应的词条,并从中选取对词条进行释义的第一段作为增强语义的内容添加到提取出的关键词中;
S2.2:对进行语义增强后的服务描述和查询请求描述信息进行词袋化处理,得到服务描述的词袋向量和查询请求的词袋向量;
S2.3:将服务描述的词袋向量和查询请求的词袋向量作为神经主题模型的输入,通过多层感知机的处理得到重参数化的参数,重参数化的结果经过softmax归一化作为服务描述的主题信息和查询请求的主题信息;
S2.3中通过输入服务描述词袋向量得到服务描述的主题信息,利用多层感知机处理输入,采用如下公式:
π=relu(Wπ·XBoW+bπ),
μ=relu(Wμ·π+bμ),
logσ=relu(Wσ·π+bσ),
其中,语义增强后的服务描述的词袋形式表述为XBoW,π为中间变量用于计算后续的μ、σ,μ、σ分别为后续重参数过程中的均值和标准差,W*表示多层感知机的参数矩阵,b*表示多层感知机的偏置项,relu激活函数的公式如下:
relu(x)=max(0,x)
S2.3中使用到的重参数化过程的公式如下:
z=u*σ+μ
其中,通过从标准正态分布中进行采样得到服从标准正态分布的多元随机变量u,使用上文中计算得出的均值μ和标准差σ进行放缩和平移,得到向量z,并使用softmax函数进行归一化输出为服务描述的主题分布,公式描述如下:
θ=softmax(relu(Wθ·z+bθ))
其中Wθ、bθ分别为多层感知机参数矩阵和偏置项,θ为当前输入文本的未进行归一化的主题分布。
2.如权利要求1所述的服务发现方法,其特征在于,S1具体包括:
S1.1:分别对Web服务描述和查询请求进行关键词抽取,抽取出自然语言词汇作为服务描述关键词和查询请求关键词;
S1.2:对抽取出的自然语言词汇进行分词、去除停用词以及词形还原处理。
3.如权利要求1所述的服务发现方法,其特征在于,S3具体包括:
对S1中预处理后的服务描述关键词通过预训练好的词向量模型,查找到对应词汇的词向量,并将服务描述中所有词汇的向量拼接成为服务描述对应的词向量矩阵;
对S1中预处理后的查询请求关键词通过预训练好的词向量模型,查找到对应词汇的词向量,并将查询请求中所有词汇的向量拼接成为查询请求对应的词向量矩阵。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010483308.1/1.html,转载请声明来源钻瓜专利网。