[发明专利]一种基于监督式表示学习的跨项目软件缺陷预测方法有效
申请号: | 201910915935.5 | 申请日: | 2019-09-26 |
公开(公告)号: | CN110751186B | 公开(公告)日: | 2022-04-08 |
发明(设计)人: | 郑征;万晓晖 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/08;G06F11/34 |
代理公司: | 北京慧泉知识产权代理有限公司 11232 | 代理人: | 李娜 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种监督式表示学习的跨项目软件缺陷预测方法:(1)选择缺陷数据集,对缺陷数据做预处理;(2)以无监督预训练方式训练迁移自编码器,迁移自编码器包括特征编码层和标签编码层;(3)借助迁移交叉验证方法,从源项目所有样本隐层特征表示中选择与目标项目样本隐层特征分布最接近的样本作为验证集,其余作为训练集;(4)对训练集样本进行过采样处理;(5)微调迁移自编码器,选择模型超参数以及提早停止策略;(6)将经预处理后的目标项目的数据输入给迁移自编码器,由标签编码层的输出得到最终的预测结果。本发明将源项目样本的标签信息引入到特征表示学习过程中,提高了跨项目软件缺陷预测模型的预测性能。 | ||
搜索关键词: | 一种 基于 监督 表示 学习 项目 软件 缺陷 预测 方法 | ||
【主权项】:
1.一种基于监督式表示学习的跨项目软件缺陷预测方法,其特征在于:该方法包括以下步骤:/n步骤1)、明确待预测的目标项目和用来训练模型的源项目,并对源项目和目标项目的原始数据进行标准化或归一化预处理操作;/n步骤2)、将源项目和目标项目中所有样本的特征向量输入给迁移自编码器,并以无监督预训练方式初步训练迁移自编码器,再由迁移自编码器的特征编码层得到源项目和目标项目所有样本的初步隐层特征表示;/n步骤3)、在步骤2)中得到初步特征表示的基础上,借助迁移交叉验证方法,从源项目样本的隐层特征表示中选择与目标项目样本隐层特征表示分布最接近的部分样本作为验证集,剩下的源项目样本作为训练集;/n步骤4)、对训练集样本进行过采样处理;/n步骤5)、在步骤4)过采样处理后的训练集上继续微调迁移自编码器,并借助验证集上的预测性能选择模型超参数以及提早停止策略完成模型的训练;/n步骤6)、迁移自编码器训练完成后,再将目标项目经过预处理的样本数据输入给迁移自编码器,并由其标签编码层得到最终的预测结果。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910915935.5/,转载请声明来源钻瓜专利网。