[发明专利]基于增强学习的软件众包项目推荐方法及系统在审

专利信息
申请号: 201811254110.5 申请日: 2018-10-26
公开(公告)号: CN111191108A 公开(公告)日: 2020-05-22
发明(设计)人: 乔润涛;沈备军 申请(专利权)人: 上海交通大学
主分类号: G06F16/9535 分类号: G06F16/9535;G06F40/289
代理公司: 上海交达专利事务所 31201 代理人: 王毓理;王锡麟
地址: 200240 *** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 增强 学习 软件 项目 推荐 方法 系统
【说明书】:

一种基于增强学习的软件众包项目推荐方法及系统,首先收集软件众包平台上的项目数据和开发者数据并为开发者和项目分别建模,得到开发者模型和项目模型;之后分别计算探索策略与利用策略方面的评分并最终相加得到总评分从而确定推荐项目,并在收到开发者对推荐项目的反馈时分别对开发者模型、项目模型以及聚类依次进行更新以提高推荐准确度。本发明利用增强学习在推荐过程中逐步学习用户偏好并更新项目和开发者模型,有效解决软件众包平台中推荐系统的开发者冷启动问题,显著提高项目推荐的准确度。

技术领域

本发明涉及的是一种信息处理领域的技术,具体是一种基于增强学习的软件众包项目推荐(ClusterUCBscRec)方法及系统。

背景技术

近年来,随着软件众包产业的发展,日益增多的个人和企业在软件众包平台中发布需求以及参与项目。软件众包平台中完成一个项目的基本流程是:1)项目发布者将项目发布到软件众包平台中,并指定对应的报酬和完成时间;2)软件众包平台中的开发者可以浏览项目,如果他们感兴趣可以收藏项目,也可以报名加入项目;3)项目发布者从众多的报名人员中选择合适的人员开发该项目;4)开发者成功完成项目后获得对应的报酬。但是在软件众包平台的推荐系统中,一直存在严重的开发者冷启动问题,即平台中的开发者数据总量偏少。因此一些传统推荐方法的训练和预测因缺乏数据无法得到理想的效果。

冷启动问题在推荐系统中是一个非常重要且常见的问题。出现在软件众包平台的推荐系统中的冷启动问题可以被细分为项目冷启动问题、开发者冷启动问题以及平台冷启动问题。当一个新项目发布到软件众包平台中时,显然没有任何用户与之有交互记录,此时无法应用传统的基于协同过滤的算法,这是项目冷启动问题;同理,一个新用户到来时,因为开发者与任何项目发生交互,所以传统协同过滤的方法也无法对该开发者进行推荐,这是开发者冷启动问题;推荐系统平台上缺乏开发者和项目间的累计协同数据,也即数据规模无法达到构建模型所需的规模,因此推荐算法模型无法训练,这是平台冷启动问题。

发明内容

本发明针对现有技术无法解决开发者冷启动问题、对软件众包平台中所需开发者及项目交互记录的总量高,要求项目描述准确反应实际项目内容等过高的要求,提出一种基于增强学习的软件众包项目推荐方法及系统,利用增强学习在推荐过程中逐步学习用户偏好并更新项目和开发者模型,有效解决软件众包平台中推荐系统的开发者冷启动问题,显著提高项目推荐的准确度。

本发明是通过以下技术方案实现的:

本发明涉及一种基于增强学习的软件众包项目推荐方法,首先收集软件众包平台上的项目数据和开发者数据并为开发者和项目分别建模,得到开发者模型和项目模型;之后分别计算探索策略与利用策略方面的评分并最终相加得到总评分从而确定推荐项目,并在收到开发者对推荐项目的反馈时分别对开发者模型、项目模型以及聚类依次进行更新以提高推荐准确度。

所述的项目数据但不限于包括:项目的基本信息(项目Id,项目类别(Web开发,APP开发),是否需要驻场,开发者类型(个人,团体或企业),预期完成时间,预算,项目发布时间)、项目技术要求(技术方向,技能要求和项目领域)以及项目关键词。

所述的开发者数据包括但不限于:开发者基本信息(开发者类型,年龄,薪资,开发者居住地点,学历,能否开票以及性别)、开发者能力(一组技能名称与对应的数值)、兴趣偏好(一组具体偏好的名称与对应的数值)。

所述的建模,具体包括:

1)利用已有的基于IK的中文分词器对需求文本分词;

为了达到更好的分词效果,在分词器中增加软件工程领域的专用词汇和中文停用词。

2)从分词结果中抽取关键词:利用已有的TF-IDF方法计算分词结果中每个分词w的TF-IDF值,对关键词按照TF-IDF值从大到小排序,将前50%的分词作为关键词。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811254110.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top