[发明专利]一种基于群体评论的开源软件推荐方法有效
申请号: | 201510617003.4 | 申请日: | 2015-09-21 |
公开(公告)号: | CN105389329B | 公开(公告)日: | 2019-02-12 |
发明(设计)人: | 王怀民;王涛;尹刚;伍名;侯翔;杨程;史殿习;刘惠;丁博;史佩昌;湛云;张洋 | 申请(专利权)人: | 中国人民解放军国防科学技术大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/951 |
代理公司: | 北京安博达知识产权代理有限公司 11271 | 代理人: | 徐国文 |
地址: | 410073 湖南*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 群体 评论 软件 推荐 方法 | ||
1.一种基于群体评论的开源软件推荐方法,包括下列步骤:
步骤101、建立开源软件数据服务器SDS(Software Data Server),采用通用Web爬虫技术从主要开源社区中采集开源软件资源信息数据,包括开源软件项目数据和评论文档数据,所述项目数据包括开源软件的项目名称、项目标签、项目主页,评论文档数据包括文档标题和文档标签;
步骤102、获取用户本地开发项目p的特征,主要包括本地项目名称和本地项目标签,并提取SDS中已采集获得的项目名称、项目标签和文档标题、文档标签,对本地开发项目及SDS中采集的项目与评论文档进行关联匹配;
其中步骤102中的关联匹配具体步骤包括:
步骤102.1、用项目名称与评论文档进行匹配,以所述项目名称为关键词查找评论文档,若所述评论文档具有与所述项目名称相同的标签,则为所述评论文档与项目建立关联,并赋予权值W1;
步骤102.2、用项目名称在评论文档标题中进行检索匹配,以项目名称为关键字搜索所有评论文档,若某个评论文档标题包含该关键字,则将该评论文档与项目建立关联,并赋予权值W2;
步骤102.3、在所有已建立的关联中,对项目标签与评论文档标题进行匹配,统计评论文档标题中包含项目标签的个数x,利用x计算项目与评论文档关联权值W3,计算公式为:W3=0.5*log2(x2+1),采用对数运算表明标签个数x与可信度的关系;
步骤102.4、在所有已建立的关联中,对项目标签与评论文档的标签进行匹配,统计在两者共同出现的标签个数y,计算权值:W4=0.6*log2(y2+1);
步骤102.5、计算最终关联权重,权重公式表示为:W=W1+W2+(W1+W2)*(W3+W4),选取合适的阀值决定软件项目是否与评论文档相关联,当权值w大于阈值q时,认为该文档与开源项目是关联的,关联结果以[软件项目,评论文档,权重]的形式存储在数据库中,软件项目包括本地开发项目及SDS中采集的项目;
步骤103、计算SDS中每一个项目q与本地开发项目p的标签文本相似性,标签文本表示为由项目标签组成的单词集合,提取项目p与项目q的项目标签,并将其表示为由自身标签组成的标签集合Tp和Tq,利用公式计算项目p与项目q的标签文本相似性;
步骤104、计算SDS中每一个项目q与项目p的相关性,根据步骤102中的关联匹配结果将项目p和q表示为向量vp和vq,向量的每一维表示与之相关联的评论文档,向量值表示匹配权重,根据余弦相似性公式:计算相关性;
步骤105、生成本地开发项目p的推荐列表,并将推荐指数值排在前N的项目的主页返回给用户,其中推荐指数值的计算是对项目相似性和相关性进行线性加权,公式表示为:Score(q→p)=w1×TDoc(p,q)+w2×Coop(p,q),其中,Score表示为项目q对项目p的推荐指数值,w1、w2均取为0.5。
2.如权利要求1所述的方法,其中步骤101中对所述项目标签和文档标签进行预处理,所述预处理包括:将项目标签和文档标签转换为其词根后将相同的词根的标签合并,删除标签数小于3的项目。
3.如权利要求1所述的方法,步骤104中的根据步骤102中的关联匹配结果将项目p和q表示为向量vp和vq,向量vp和vq的值根据分别包含项目p和q匹配结果的结果集中的权重值确定,项目p可表示为vp=(Wp1,Wp2,..,Wpn);项目q可以表示成vq=(Wq1,Wq2,..,Wqk),Wpn及Wqk分别是结果集中的权重值,n和k均大于等于1。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科学技术大学,未经中国人民解放军国防科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510617003.4/1.html,转载请声明来源钻瓜专利网。