[发明专利]一种基于链接预测的服务组合推荐方法有效
申请号: | 201810446024.8 | 申请日: | 2018-05-11 |
公开(公告)号: | CN108681580B | 公开(公告)日: | 2019-06-28 |
发明(设计)人: | 陈明;崔霄;李玉华;梁树军;马欢;李聪;黄艳;曹洁;张静静;高铁梁 | 申请(专利权)人: | 郑州轻工业学院 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;H04L29/08 |
代理公司: | 郑州优盾知识产权代理有限公司 41125 | 代理人: | 郑园;栗改 |
地址: | 450002 *** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出了一种基于链接预测的服务组合推荐方法,用以解决现有方法中只关注单个服务API或服务流程方案,忽视了在现实中用户组建服务时既有单个服务推荐需要也有业务流程推荐需求的问题,本发明包括数据集整理、链接模型训练与预测、服务组合推荐,可以根据用户创建服务组合中的行为推荐用户所需要的服务组件和服务组合,通过链接预测的算法给用户推荐单个服务组件,根据朴素贝叶斯分类器给用户推荐符合用户兴趣的服务组合。本发明能够为用户推荐和调用相匹配的服务,缓解了用户在组建服务时出现服务不匹配的问题;不仅缩减了用户创建服务所需开销,还能让模板库中组合得到复用,对轻量级服务组合的发展具有重要推动作用。 | ||
搜索关键词: | 服务组合 链接 单个服务 用户推荐 预测 用户创建 匹配 朴素贝叶斯分类器 服务 服务流程 服务组件 模型训练 行为推荐 业务流程 用户兴趣 模板库 数据集 调用 复用 算法 组建 缓解 | ||
【主权项】:
1.一种基于链接预测的服务组合推荐方法,其特征在于,包括数据集整理、链接模型训练与预测、服务组合推荐,其步骤如下:数据集整理包括:1a)整理用户服务数据集;1b)整理服务组合数据集;链接模型训练与预测包括:2a)通过用户服务数据集中的服务链接关系扩充服务组件集合;2b)将扩充服务组件集合分解成二部图;2c)根据二部图计算每个服务的hub值,利用hub值给用户推荐能与其链接的服务;所述步骤2a)通过用户服务数据集中服务链接关系扩充服务组件集合的方法为:1)在用户服务数据集中找到用户的前n项服务作为种子服务集合,此集合为服务组件的根集合;2)在种子服务集合的基础上,通过查找用户服务数据集,找到与种子服务集合有直接链接关系的服务组件并将其纳入集合中,形成扩充服务组件集合;所述步骤2b)中扩充服务组件集合分解成二部图的方法如下:1)将扩展服务组件集合中的服务组件转换为二个子集合hub和authority;2)如果一个服务组件有出度,将此组件加入出度子集合,此集合定义为hub子集合;如果一个服务组件有入度,将此组件加入到入度子集合,此集合定义为authority子集合;当一个服务组件既有出度也有入度时,将此服务组件同时归入上述两个集合中;所述步骤2c)中利用hub值给用户推荐能与其链接的服务的方法为:1)根据二部图的链接关系,通过多次迭代生成hub子集合的节点转移图,即hub集合的连通图;2)根据二部图和节点迁移图计算出hub子集中每个节点ai1的权值rai1,rai1即为节点的hub值,计算公式为:
其中,A为二部图中hub子集合的节点数,Aj1为组件ai1所在节点迁移图的节点数,Oj1为组件ai1所在节点迁移图中包含的出度总数,B(i1)为二部图中组件ai1的出度个数;3)根据节点迁移图向用户推荐能与其所选服务链接的其他服务,其他服务按照hub值从高到低的顺序排序,即优先推荐与其能链接的hub值比较大的服务组件;服务组合推荐包括:3a)确定用户已选择的服务组件集,通过信息增益算法约减服务组件集;3b)根据约减后的服务组件集调用朴素贝叶斯分类器确定用户的兴趣;3c)根据步骤3a) 中确定的用户已选择的服务组件集和步骤3b)中确定的用户兴趣,向用户推荐相似的服务组合;所述步骤3a)中通过信息增益算法约减服务组件集的方法为:1)根据服务组合数据集,离线计算服务系统中有这个服务组件的熵H(C);2)根据服务组合数据集,离线计算服务系统中没有这个服务组件的熵H(C|s);3)计算熵H(C)和熵H(C|s)两者差值即为此服务组件的分类增益值;
其中,P(ci|s)代表服务s属于兴趣类别ci的概率,P(ci)代表兴趣类别ci在所有兴趣类别中所占服务数的比例,
代表兴趣类别ci中不包含服务s的概率;4)将用户已选择的服务组件集根据分类增益值排序,前n1个服务组件即为约减后的服务组件集;所述步骤3b)中用贝叶斯分类器确定用户兴趣的方法为:1)根据服务组合数据集,离线计算服务系统中各个服务组件属于不同用户兴趣类别的概率
其中,scj代表服务组件,SC代表用户访问的组件序列(sc1,sc2,...,scn1),ci代表不同用户兴趣的类别,(c1,c2,...,cm)表示兴趣类别变量C,n(ci)代表兴趣类别ci在整个类别组件库中所占服务个数,p(scj|ci)代表在兴趣类别ci中组件scj出现的次数;2)根据概率P(ci|scj)利用朴素贝叶斯分类器计算约减后的服务组件集SC(sc1,sc2,...,scn1)属于各类兴趣的概率:P(ci|sc1,sc2,…,scn1)∝P(sc1,sc2,...,scn1|ci)P(ci),
其中,P(ci)代表兴趣类别ci在整个兴趣类别组件库中占的比例;3)选择概率最大的类别作为用户的兴趣:
所述步骤3c)中根据用户兴趣推荐服务组合的方法为:1)选择服务组合数据集中和用户兴趣相符的服务组合;2)使用n‑gram算法计算服务组合和用户已选择的约减后的服务组件集之间的距离;3)根据距离的大小推荐和用户兴趣最相似的服务组合,求服务组合Sl和Sp的相似度的公式如下:Sim(Sl,Sp)=GN(Sl)+GN(Sp)‑2×|GN(Sl)∩GN(Sp)|;其中,GN(Sl)表示服务组合Sl的服务组件个数,GN(Sp)表示服务组合Sp的服务组件个数,GN(Sl)∩GN(Sp)代表两个服务组合中相同的组件个数。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州轻工业学院,未经郑州轻工业学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810446024.8/,转载请声明来源钻瓜专利网。
- 上一篇:一种大数据遗漏率分析方法
- 下一篇:一种就业数据的协同过滤方法及系统