[发明专利]基于混合效应线性回归模型的项目流行度分析方法有效
申请号: | 201810377403.6 | 申请日: | 2018-04-25 |
公开(公告)号: | CN108647863B | 公开(公告)日: | 2020-10-27 |
发明(设计)人: | 常俊胜;胡东阳;王涛;余跃;王怀民;尹刚;李耀宗 | 申请(专利权)人: | 中国人民解放军国防科技大学 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q10/10 |
代理公司: | 北京知联天下知识产权代理事务所(普通合伙) 11594 | 代理人: | 李学康;吴鑫 |
地址: | 410073 湖南*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 混合 效应 线性 回归 模型 项目 流行 分析 方法 | ||
针对现有研究分别单独探索缺陷报告和特征报告,对项目流行度的评估具有片面性的问题,本发明提供一种基于混合效应线性回归模型的项目流行度分析方法,通过从GitHub上收集项目数据,然后使用统计分析和回归建模,给出了项目中缺陷报告数量和特征报告数量对项目流行度的影响关系,通过项目中缺陷报告和特征报告对项目流行度影响因子的不同,分析项目流行度的提高与缺陷报告和特征报告的关系;进一步地,通过对缺陷报告和特征报告的描述多样性进行了四个维度的分析,找出缺陷报告和特征报告在描述多样性上的区别。本发明通过分析项目中缺陷报告数量和特征报告数量的差别对比来综合研究项目流行度,可以全面评估项目的流行度。
技术领域
本发明属于计算机开源软件分析领域,尤其是一种项目开发过程中缺陷报告(bugissue)和特征报告(feature issue)对项目流行度影响的分析方法。
背景技术
软件开发是一个复杂过程,包含很多步骤和相关开发人员。软件开发过程中通常会出现代码缺陷(bug),或者提出新的功能(feature),所以,缺陷报告(bug issue)和特征报告(feature issue)是软件项目发展过程中两个非常重要的因素。
有不同目标和需求的项目中bug issue和feature issue的数量会有所不同,bugissue和feature issue的数量差别会对项目开发产生一定的影响,比如项目的流行度。现有研究主要是分别探索bug issue和feature issue,对项目流行度的判断存在片面性。
GitHub是一个拥有数以亿计用户的开源代码托管网站。它允许开发人员创建和管理项目。GitHub包含数以亿计的软件项目信息。GitHub提供了一些特征比如花(followers)、种子(feeds)、网络图(network graph)和报告(issue)等,这些可以帮助开发者更好地管理代码仓库。GitHub的issue会有很多种类的标签,GitHub也没有提供缺陷标签和特征标签的具体解决和区分。通过检查issue的标签种类,可以自动识别出bug issue和feature issue。GitHub项目可以通过REST APIs进行检索,为各种应用领域(比如游戏软件,web应用程序,操作系统等)提供了各种类型的项目。项目中的编程语言也是风格百变,开发人员的数量也是有多有少。所以这些项目特征使GitHub成为一个非常具有吸引力的开源平台去收集数据进行实证研究。在先前的工作中,GitHub上的数据被用来对编程语言、项目的流行程度进行大规模的研究,并对软件测试进行研究。
混合效应线性回归模型与普通的线性模型不同的地方是除了有固定效应外还有随机效应,回归效果更具有全面性和抗噪性。混合效应线性回归模型有时又称为多水平线性模型或层次结构线性模型。
混合效应线性回归模型公式为:
Y=Xβ+ZU+ε
其中,Y是因变量向量,X是自变量矩阵,β为与X对应的固定效应参数向量,Z为随机效应变量矩阵,其构造与X相同。U为与Z对应的随机效应参数向量,ε为噪声向量。
现在尚无利用混合效应线性回归模型进行项目流行度分析的方法。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科技大学,未经中国人民解放军国防科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810377403.6/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理