[发明专利]基于软件开发过程的软件度量方法、系统及电子设备有效
申请号: | 201811302823.4 | 申请日: | 2018-11-02 |
公开(公告)号: | CN109583476B | 公开(公告)日: | 2022-10-18 |
发明(设计)人: | 宁德军;王煜 | 申请(专利权)人: | 中国科学院上海高等研究院 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F8/20 |
代理公司: | 上海光华专利事务所(普通合伙) 31219 | 代理人: | 庞红芳 |
地址: | 201210 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 软件 开发 过程 度量 方法 系统 电子设备 | ||
本发明提供一种基于软件开发过程的软件度量方法、系统及电子设备,所述系统包括:数据采集模块,用于获取软件各维度的数据,作为基本度量元;预处理模块,用于将选取的部分基本度量元转换成派生度量元;软件度量模块,用于根据预设的软件度量模型对输入的所述基本度量元和所述派生度量元进行处理,获取软件质量指数、用户活性指数、团队活性指数及健康状态感知指数等。本发明从用户活性、团队活性、软件质量等维度对开源项目进行了全面、准确的刻画,生成了基于软件开发过程的软件度量模型,使用该软件度量模型,可以快速计算出开源项目的用户活性指数、团队活性指数、软件质量指数及健康状态感知指数等,帮助软件团队客观了解软件状况,及时发现问题。
技术领域
本发明涉及数据挖掘技术领域,特别是涉及一种基于软件开发过程的软件度量方法、系统及电子设备。
背景技术
主成分分析(Principal Component Analysis,简称PCA),是考察多个变量间相关性一种多元统计方法,研究如何通过少数几个主成分来揭示多个变量间的内部结构,即从原始变量中导出少数几个主成分,使它们尽可能多地保留原始变量的信息,且彼此间互不相关。通常数学上的处理就是将原来多个指标作线性组合,作为新的综合指标。
爬虫技术是一种“自动化浏览网络”的程序,它按照一定的规则,自动在万维网上抓取用户需要的信息。随着互联网的发展,网络成为大量信息的载体。爬虫技术也成为数据采集的重要组成部分,是大数据分析中最为基础的一步。除了网络爬虫,众多平台也开放了自己的数据接口,方便开发者接入,如Github、微博等。
在互联网+时代,开源软件开发以其免费、开放源码、过程透明、无使用限制等特征获得巨大成功,开源软件的定义、设计、开发和使用过程由众多专业的自愿者以社会化的群体并行开发的基本方式完成。与此同时,开源社区如Github等由于托管了大量优质开源项目而得到众多软件开发者的追捧。然而,Github开源社区中也存在大量不成功项目,据统计,Github开源社区共有8000多万项目,其中仅有535万左右项目被star,占6.7%。因此,如何从海量项目中快速找到优质开源项目供众多开发者学习、参与显得尤为重要;另一方面,如何帮助众多软件团队客观了解所开发软件的水平,及时发现问题,积极采取对应措施,使开源项目健康持续发展十分迫切。
发明内容
为了解决上述的以及其他潜在的技术问题,本发明的实施例提供了一种基于软件开发过程的软件度量系统,所述基于软件开发过程的软件度量系统包括:数据采集模块,用于获取软件各维度的数据,作为基本度量元;预处理模块,用于将选取的部分基本度量元转换成派生度量元;软件度量模块,用于根据预设的软件度量模型对输入的所述基本度量元和所述派生度量元进行处理,获取软件质量指数、用户活性指数、团队活性指数及健康状态感知指数。
于本发明的一实施例中,所述基于软件开发过程的软件度量系统还包括:训练数据获取模块,用于根据过滤条件获取开源软件数据;相关性分析模块,用于基于所述开源软件数据,对派生度量元和基本度量元进行两两相关性分析,并根据相关性分析结果将各所述度量元映射到用户活性维度、团队活性维度、软件质量维度;主成分分析模块,分别对所述用户活性维度、所述团队活性维度、所述软件质量维度的度量元做主成分分析,获取用户活性指数、团队活性指数和软件质量指数的计算公式;软件度量模型生成模块,基于所述用户活性指数、团队活性指数和软件质量指数的计算公式生成所述软件度量模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院上海高等研究院,未经中国科学院上海高等研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811302823.4/2.html,转载请声明来源钻瓜专利网。