[发明专利]一种基于高维数据混合约简的缺陷报告指派方法有效
申请号: | 201910770489.3 | 申请日: | 2019-08-20 |
公开(公告)号: | CN110471854B | 公开(公告)日: | 2023-02-03 |
发明(设计)人: | 郭世凯;王佳慧;郑圣杰;陈荣;李辉;唐文君 | 申请(专利权)人: | 大连海事大学 |
主分类号: | G06F11/36 | 分类号: | G06F11/36;G06F40/284;G06F18/2415;G06N3/126 |
代理公司: | 大连东方专利代理有限责任公司 21212 | 代理人: | 姜玉蓉;李洪福 |
地址: | 116026 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 数据 混合 缺陷 报告 指派 方法 | ||
本发明公开了一种基于高维数据混合约简的缺陷报告指派方法,包括如下步骤:S1:从缺陷报告系统中获取缺陷报告的故障文本信息、故障元信息和故障触发时间信息;S2:将缺陷报告定义为文本,选择能表现文本信息的词段,并采用分词、去停词、词干化和向量空间表示方法对缺陷报告进行标准化处理,S3:基于差分进化算法采用特征选择、实例选择和二者相结合的方式对缺陷报告进行数据约简;S4:读取缺陷报告的开发人员参与度信息,筛选处理过具有相同产品信息的bug报告的开发人员,对缺陷报告进行再次分类;S5:当有未被分类的缺陷报告提交时,使用结合开发人员参与度的数据约简策略为其分类,分配合适的开发人员处理该缺陷报告。
技术领域
本发明涉及bug报告分派技术领域,尤其涉及一种基于高维数据混合约简的缺陷报告指派方法。
背景技术
软件项目的bug修复在软件维护中占有重要地位。目前缺陷报告自动指派是解决bug修复问题的高效经济方式。缺陷报告指派基于文本分类技术为一个新的缺陷报告分类,匹配一个开发人员进行bug修复。而bug数据的大规模和低质量两个特点降低了软件维护过程中bug仓库的使用效率,影响了新缺陷报告的有效指派。对此,在现有技术结合特征选择和实例选择技术去除了冗余和非信息的缺陷报告和单词,实现了数据约简,这样可以从历史bug数据集中提取属性,利用提取的属性对bug数据集进行二值分类器训练,预测了新的缺陷报告应用特征选择和实例选择的顺序。上述方法中结合特征选择和实例选择对缺陷报告数据进行属性约简的方法得到了规模较小、质量较高的缺陷报告,并且提出了一个应用特征选择和实例选择的顺序的预测模型。但它的属性约简方法的缺陷报告指派准确度并不高,不能有效的约简缺陷报告数据,适用性不强。另外,它的缺陷报告指派只是基于文本信息,没有考虑到开发人员的参与度的问题,最近出现的开发人员可能表现更活跃,而长期任职的开发人员可能会改变职位或离职,这也导致缺陷报告指派准确度下降。
发明内容
根据现有技术存在的问题,本发明公开了一种基于高维数据混合约简的缺陷报告指派方法,具体包括如下步骤:
S1:从缺陷报告系统中获取缺陷报告的故障文本信息、故障元信息和故障触发时间信息,将获取的信息定义为缺陷报告数据集,其中缺陷报告数据集还包括缺陷报告的对应开发人员信息;
S2:将缺陷报告定义为文本,选择能表现文本信息的词段,并采用分词、去停词、词干化和向量空间表示方法对缺陷报告进行标准化处理,获得每条缺陷报告的单词向量形式,将缺陷报告数据集转化为一个词矩阵;
S3:基于差分进化算法采用特征选择、实例选择和二者相结合的方式对缺陷报告进行数据约简;
S4:读取缺陷报告的开发人员参与度信息,筛选处理过具有相同产品信息的bug报告的开发人员,对缺陷报告进行再次分类;
S5:当有未被分类的缺陷报告提交时,使用结合开发人员参与度的数据约简策略为其分类,分配合适的开发人员处理该缺陷报告。
进一步的,S3中:其中特征选择的方式为在样本的特征空间上选择一部分特征对进行数据约简,实例选择方式为在原始样本中选择一部分样本进行数据约简,特征选择和实例选择相结合的方式为同时在特征空间和样本空间上选择样本进行数据约简。上述三种方法的不同之处在于种群初始化方法:
特征选择按照特征的重要程度顺序将不同的特征集合加入到特征选择的初始方案中;实例选择采用随机生成的10种初始化方案;特征选择和实例选择相结合的方式的初始化种群是二者方案的组合。
三种方法的相同之处在于种群初识化之后的操作:种群初始化后,记录适应度函数值最大的初始种群个体及其适应度值;父代种群选择一种变异操作得到子代,变异方法主要包括差分变异、交叉变异和随机变异:
差分变异:判断是否进行差分变异,若进行差分变异则对比选中的变异位置数值与最优个体的相应位置的数值,若相同则将子代变异位置置为1,否则随机生成变异位数值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连海事大学,未经大连海事大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910770489.3/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置