[发明专利]一种可追溯可验证的软件工程数据归档方法有效
申请号: | 202110367226.5 | 申请日: | 2021-04-06 |
公开(公告)号: | CN113064628B | 公开(公告)日: | 2022-06-17 |
发明(设计)人: | 朱家鑫;陈伟;吴国全;窦文生;魏峻;叶丹 | 申请(专利权)人: | 中国科学院软件研究所 |
主分类号: | G06F8/70 | 分类号: | G06F8/70;G06Q10/10;G06F16/11;G06F16/16 |
代理公司: | 北京君尚知识产权代理有限公司 11200 | 代理人: | 李文涛 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 追溯 验证 软件工程 数据 归档 方法 | ||
本发明提供一种可追溯可验证的软件工程数据归档方法,涉及软件工程数据领域,基于数据单元和数据卷组织软件工程数据,保存数据单元间的衍生关系及衍生环境构建脚本和数据衍生脚本,提供自动化的数据再衍生和一致性验证机制。本发明实现了对准备归档和已归档的软件工程数据的自动化追溯和验证,能够帮助相关开发者、研究者获得高可靠的软件工程数据。
技术领域
本发明涉及软件工程数据领域,尤其涉及一种可追溯可验证的软件工程数据归档方法。
背景技术
本发明所涉及的软件工程数据是软件开发、运维过程中由相关支撑工具产生的各类数据,例如版本控制数据、缺陷追踪数据等。这些数据可以用来开展很多软件工程相关的研究,帮助提供软件开发运维的效率,以及软件产品的质量。
软件工程的数据种类繁多,数据产生的上下文复杂,很多数据处理的过程不透明,这导致很多数据使用者对数据的理解有较大偏差,进而对相关数据分析结果的有效性产生影响,同时,数据处理的过程不透明也造成了数据质量的不确定性,也会威胁数据分析结果的有效性。
目前已经出现了很多软件工程数据的共享项目,例如共享GitHub数据的GHTorrent项目(https://ghtorrent.org/),综合性的Promise项目(http://promise.site.uottawa.ca/SERepository/)等。现有的软件工程数据共享项目主要关注的数据上传、存储、检索以及下载等数据可得性问题,并没有建立数据的追溯和验证机制,特别是自动化的机制,无法避免数据误用问题和数据质量问题。
发明内容
针对现有软件工程数据共享项目没有避免数据误用问题和数据质量问题的机制,本发明提出一种可追溯可验证的软件工程数据归档方法,基于数据单元与数据卷组织软件工程数据,保存数据单元间的衍生关系及衍生环境配置和衍生脚本,提供自动化的数据再衍生和一致性验证机制。
为了实现上述目的,本发明采用以下技术方案:
一种可追溯可验证的软件工程数据归档方法,其步骤包括:创建数据单元和数据卷,将软件工程数据按照数据单元和数据卷进行存档;数据单元作为数据存档的最小单元,包括数据单元描述文件、数据文件、数据单元文档文件、环境文件和脚本文件这五类文件;数据卷作为面向一定的数据使用需求制作的数据集,包括数据卷描述文件和数据卷文档文件这两类文件,通过数据卷描述文件中的数据单元索引来引用自己所包含的数据单元;其中,
每一个所述数据单元描述文件包含14个域:索引号、名称、完整描述、短描述、作者、版本号、创建时间、许可证、数据源类型、数据源索引、环境索引、脚本入口索引、上一版本号、下一版本号;其中,短描述是完整描述的摘要,用于数据使用者快速浏览和检索;数据源类型包括原始数据类型和数据单元类型两种,原始数据是软件开发工具所直接产生和存储的数据;数据源索引包括原始数据类型和数据单元类型的数据源索,原始数据类型的数据源索引使用URL,数据单元类型的数据源索引使用数据单元索引号;环境索引是环境文件的相对地址;脚本入口索引是脚本入口的相对地址;
所述数据文件用于存放主体数据;
所述数据单元文档文件用于描述数据单元主体数据的相关背景、数据格式、使用方法和使用示例;
所述环境文件用于描述环境的配置和环境构建步骤;
所述脚本文件包括四类:环境构建脚本文件、环境构建脚本入口文件、数据衍生脚本文件和数据衍生脚本入口文件;
每一个所述数据卷描述文件包含11个域:索引号、名称、完整描述、短描述、作者、版本号、创建时间、许可证、数据单元索引号、上一版本号、下一版本号;其中,短描述是完整描述的摘要,用于数据使用者快速浏览和检索;
所述数据卷文档文件用于综合系统地描述要解决的应用问题、数据处理流程和处理结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院软件研究所,未经中国科学院软件研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110367226.5/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置