[发明专利]基于增强学习的软件众包项目推荐方法及系统在审
申请号: | 201811254110.5 | 申请日: | 2018-10-26 |
公开(公告)号: | CN111191108A | 公开(公告)日: | 2020-05-22 |
发明(设计)人: | 乔润涛;沈备军 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F40/289 |
代理公司: | 上海交达专利事务所 31201 | 代理人: | 王毓理;王锡麟 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 增强 学习 软件 项目 推荐 方法 系统 | ||
1.一种基于增强学习的软件众包项目推荐方法,其特征在于,首先收集软件众包平台上的项目数据和开发者数据并为开发者和项目分别建模,得到开发者模型和项目模型;之后分别计算探索策略与利用策略方面的评分并最终相加得到总评分从而确定推荐项目,并在收到开发者对推荐项目的反馈时分别对开发者模型、项目模型以及聚类依次进行更新以提高推荐准确度;
所述的项目数据包括:项目的基本信息、项目技术要求以及项目关键词;
所述的开发者数据包括:开发者基本信息、开发者能力、兴趣偏好。
2.根据权利要求1所述的方法,其特征是,所述的建模,具体包括:
1)利用已有的基于IK的中文分词器对需求文本分词;
2)从分词结果中抽取关键词;
3)归一化处理;
4)词向量合并;
5)使用PCA算法对词向量进行降维处理;
6)设定开发者模型并进行初始化。
3.根据权利要求2所述的方法,其特征是,所述的TF-IDF值是指:每个项目的所有关键词表示为一个词向量,词向量中关键词的值为该关键词的TF-IDF值;所述的TF-IDF方法是指:计算其中:nw,d是在项目描述d中词语w出现的次数,|j:w∈dj|表示包含单词w的项目描述的数量。
4.根据权利要求2所述的方法,其特征是,所述的词向量合并是指:将项目数据中经过特征归一化得到的项目基本信息与项目技术要求词向量tech以及项目关键词词向量keyword合并为一个词向量v,当techLength为tech的长度,keywordLength为keyword的长度,则v[j]=tech[j],v[techLength+m]=keyword[m],j∈[0,techLength),m∈[0,keywordLength)。
5.根据权利要求2所述的方法,其特征是,所述的初始化是指:按历史交互数据中各个记录的发生时间依次输入推荐系统的学习反馈部分执行学习反馈的过程,具体包括:
1)根据历史交互记录确定反馈类型,得到交互有效性数值;
2)对项目模型与开发者模型中的特征向量进行更新;
3)检查开发者所属聚类是否需要拆分;
4)检查对应步骤3)的项目聚类是否需要修改,遍历所有项目从而完成推荐系统、开发者与项目模型的初始化。
6.根据权利要求2所述的方法,其特征是,所述的开发者模型包括:开发者兴趣特征向量和开发者技能特征向量为所述的项目模型包括:项目兴趣特征向量和项目技能特征向量为
7.根据权利要求1所述的方法,其特征是,所述的推荐,具体包括:
i)根据开发者基本信息对项目进行过滤;
ii)根据当前项目模型与开发者模型的具体取值对各个候选项目打分并排序,将打分最高的k个项目设置为推荐项目。
8.根据权利要求7所述的方法,其特征是,所述的打分,具体是指:对兴趣匹配程度进行打分和对能力匹配程度进行打分,具体是指:①建立公式其中:矩阵A1为由开发者历史交互项目的兴趣特征向量所组成,b1为开发者历史交互项目的交互有效性所组成的,c1为该开发者的兴趣特征向量,α1为参数;②建立公式其中:A2由开发者历史交互项目的技能相关特征向量所组成,组成方式也与A1相同,b2与b1相同,α2为参数;③计算最终评分M,建立公式M=M1+α3M2,其中:α3为参数。
9.一种实现上述任一权利要求所述方法的系统,其特征在于,包括:资源建模模块、项目推荐模块和学习反馈模块,其中:资源建模模块生成项目模型与开发者模型,项目推荐模块根据当前项目模型与开发者模型向开发者推荐项目,学习反馈模块根据开发者对推荐项目的反馈更新项目模型与开发者模型以及相应聚类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811254110.5/1.html,转载请声明来源钻瓜专利网。