[发明专利]一种基于开源软件邮件网络的角色推荐方法有效

专利信息
申请号: 202011265544.2 申请日: 2020-11-13
公开(公告)号: CN112347373B 公开(公告)日: 2022-06-17
发明(设计)人: 宣琦;谢昀苡;张剑 申请(专利权)人: 浙江工业大学
主分类号: G06F16/9536 分类号: G06F16/9536;G06F16/9537;G06N3/04;G06N3/08
代理公司: 杭州天正专利事务所有限公司 33201 代理人: 王兵
地址: 310014 浙*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 软件 邮件 网络 角色 推荐 方法
【说明书】:

本发明提出了一种基于开源软件邮件网络的角色推荐方法,包括以下步骤:S1:根据开源软件项目的邮件数据,构建无向有权网络;S2:对S1中构建的网络随机删除部分连边作为测试样本,将删除连边后的网络中剩余的连边作为训练样本并构建动态序列切片网络;S3:在动态序列切片网络上采用时序有偏游走算法生成每个节点的特征,再通过对两两节点的特征求均值得到连边的特征;S4:采用逻辑回归分类器对训练样本进行学习,并对测试样本进行预测。本发明能够有效地在开源软件项目中进行角色推荐,相比未考虑开源软件项目中邮件的时序信息和角色信息的算法,显著的提高了推荐的准确率。

技术领域

本发明涉及复杂网络中的链路预测领域,特别是涉及一种基于开源软件邮件网络的角色推荐方法。

背景技术

开源软件的快速发展在过去的几年里变得非常突出。吸引大量用户加入开源软件社区。开发人员和用户的积极参与对开源软件项目的成功至关重要。为了促进开源软件项目的可持续发展,开发人员需要维护项目代码。同样,激励、吸引和留住用户和开发人员也是至关重要的。然而,以往的研究大多集中在项目代码的维护上,而忽视了用户在开源软件项目开发中的重要性。为了保持项目代码的质量,存在许多基于代码存储库的方法用于生成开发人员名单,推荐排名靠前的开发人员来帮助执行代码变更。不难想象,推荐开发人员可以保持项目代码的稳定性。开发人员为项目的可持续发展做出了贡献,但同时也必须关注使用软件的用户。因为他们向开发人员提供反馈,维护开源软件项目的发展,而且他们也是潜在的开发人员,这意味着有一天他们可能会通过提交代码来为开源软件做出贡献。

用户和开发人员参与开源软件项目需要克服许多障碍,这些障碍阻碍了他们对开源软件项目的进一步贡献。由于邮件是开源软件社区中的公共沟通渠道,用户和开发人员在项目中经常使用这种方式进行互动,即缺乏理解和指导的人通常会发布问题,请求帮助或利用邮件列表中现有的信息解决疑惑。然而,由于信息量大,访问起来并不容易。而收到的答复没有提供指导或未经处理的回复可能导致他们无法获得有用的帮助。用户和开发人员面临的障碍将导致他们放弃对开源软件项目的进一步贡献。因此可以为主要帮助的开发人员和用户推荐一些有经验的人来避免这种情况。

申请号为CN202010338549.7的中国专利申请公开文本所公开的一种开源软件开发中Pull Request的评审者推荐方法,考虑了评审者与Pull Request内容的兴趣相关性、活跃度、社交关系影响程度及文件路径相关性四个方面的因素,通过贝叶斯个性化排序方法对四方面因素进行个性化加权,从而为Pull Request推荐合适的代码评审人员,这是一种基于对开源软件中的开发人员手工提取特征的推荐方法。而本项专利申请更加关注开源软件项目的邮件信息而不是代码存储库,并且考虑的范围更加广泛,不仅仅是考虑开源软件中的开发人员同时也关注了使用开源软件的用户。并且本项专利申请从网络的层面对开源软件项目的邮件数据进行建模,并考虑网络中节点的嵌入性,这能发现开源软件项目中用户和开发人员更多重要的交互,从而有利于开源软件中为需要帮助的参与者进行角色推荐。

涉及特定针对开源软件的角色推荐工作的文献非常少。Canfora等人基于开源软件提出了一种无监督的方法,通过从开源软件项目的邮件列表和代码存储库中挖掘数据并进行角色推荐。他们把重点放在开源软件项目的代码存储库上,计算开发人员和用户之间的得分,从而能为用户和开发人员推荐合适的人员对他们进行帮助。然而,这只是一个实证研究,并不是一个普遍适用的方法。

当前流行的方法是将数据建模成网络的形式,并通过图嵌入的方法将网络中的节点转换为低维向量表示(这些向量则代表网络节点的特征),并将角色推荐问题转换为机器学习中的链路预测任务。Grover提出的Node2vec方法,这是一种非常易于应用的游走方法,它结合了深度优先游走和广度优先游走,将网络中的节点用低维向量表示,从而提取出节点的网络结构特征,能够更加准确地进行角色推荐。

发明内容

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011265544.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top