[发明专利]一种众包开发者推荐方法和装置有效
申请号: | 202011156133.X | 申请日: | 2020-10-26 |
公开(公告)号: | CN112396092B | 公开(公告)日: | 2023-09-29 |
发明(设计)人: | 蒋竞;吴秋迪;张莉 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G06F18/2431 | 分类号: | G06F18/2431;G06F40/279;G06Q40/04 |
代理公司: | 北京天达知识产权代理事务所有限公司 11386 | 代理人: | 牛洪瑜 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 开发者 推荐 方法 装置 | ||
1.一种众包开发者推荐方法,其特征在于,包括:
从开源社区的众包平台中获取多个众包任务数据,其中,所述多个众包任务数据包括:任务特征数据、开发者特征数据、开发者在开源社区中的数据以及开发者与任务的历史关系数据,所述开发者特征数据包括:开发者的注册任务总数、开发者最近一次注册时间、开发者影响关系图排名、最近三个月开发者注册的任务数、开发者注册但尚未完成的任务数、最近的十次任务开发者注册的任务数,所述开发者影响关系图排名的获取步骤进一步包括:构建开发者影响关系图,其中,当所述开发者影响关系图中的边从第一开发者指向第二开发者时,所述边的值为所述第一开发者和所述第二开发者都注册的任务数量除以所述第二开发者的任务数量;根据PageRank算法,所述开发者关系影响图中当前节点的PageRank值等于所述当前节点对其他节点的影响之和;以及根据所述PageRank值的大小进行排序,获取所述开发者影响关系图排名;
将所述多个众包任务数据转换为输入矩阵;
根据所述输入矩阵和众包任务与开发者的标记构建LGBM模型,并对所述LGBM模型进行训练,以获得LGBM预测模型;以及
利用所述LGBM预测模型对待推荐任务进行开发者预测,以确定待推荐的开发者列表,其中,所述开发者与任务的历史关系数据进一步包括:开发者与任务所需的技能的匹配度、时间衰减的开发者历史注册任务的文本与当前任务的文本之间的相似度、开发者历史注册任务的类型与当前任务的类型的匹配程度、时间衰减的开发者与任务发布者的历史关系以及开发者历史注册任务的技能与当前任务的技能的匹配程度,其中,
所述时间衰减的开发者历史注册任务的文本与当前任务的文本之间的相似度S的计算公式如下:
U为开发者,C为当前任务,tc为任务C的创建时间,USetc为开发者在时间tc之前注册的任务集合,tcj为对于任务Cj∈USetc,获取Cj创建时间,并通过Word2Vec计算Cj与C的文本向量,Scj为利用向量的余弦距离计算文本相似度;以及
所述时间衰减的开发者与任务发布者的历史关系L的计算公式如下:
其中,U为开发者,C为当前任务,tc为任务C的创建时间,RSetc为发布者R在时间tc之前发布的任务集合,USetc为开发者U在时间tc之前注册的任务集合,则RSetc∩USetc为R与U在tc之前的任务交集,所述任务交集反映U对于R发布的任务的兴趣度。
2.根据权利要求1所述的众包开发者推荐方法,其特征在于,所述任务特征数据包括:任务持续时间、任务所需的技能、任务的标题、任务的文本描述、任务的难度、任务预计消耗时间、任务的虚拟货币奖励、任务的美元奖励。
3.根据权利要求1所述的众包开发者推荐方法,其特征在于,所述开发者在开源社区中的数据包括:开发者在开源社区中的注册时间、粉丝数、关注者数、发布开源项目数和参与开源项目数。
4.根据权利要求1至3中的任一项所述的众包开发者推荐方法,其特征在于,将所述多个众包任务数据转换为输入矩阵进一步包括:
将每个众包任务和每个开发者的所述开发者特征数据、所述任务特征数据、所述开发者在开源社区中的数据和所述开发者与任务的历史关系数据分别作为特征向量中的元素,以生成特征向量列;以及
利用所述多个众包任务和多个开发者的多列特征向量构成所述输入矩阵,所述输入矩阵包括x*y行和z列,其中,x对应于众包任务的数量,y对应于开发者的数量,z对应于所述特征向量列中的元素数量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011156133.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种钢化玻璃用快速清洁设备
- 下一篇:一种远程Delta机器人分拣监控系统