[发明专利]软件故障严重等级判定方法及装置、模型训练方法及装置有效
申请号: | 201910805751.3 | 申请日: | 2019-08-29 |
公开(公告)号: | CN110502445B | 公开(公告)日: | 2023-08-08 |
发明(设计)人: | 陈理国;关昕;马由;汤艳;商伟 | 申请(专利权)人: | 中国电子科技集团公司第十五研究所 |
主分类号: | G06F11/36 | 分类号: | G06F11/36 |
代理公司: | 北京方韬法业专利代理事务所(普通合伙) 11303 | 代理人: | 党小林 |
地址: | 100000 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 软件 故障 严重 等级 判定 方法 装置 模型 训练 | ||
本发明实施例提供了一种软件故障严重等级判定方法及装置、模型训练方法及装置。所述判定方法包括:利用多个所述故障判断模型对故障进行实时预测;对多个所述故障判断模型的实时预测结果进行加权平均,得到对软件故障的故障等级判断。本发明实施例提供的软件故障严重等级判定方法及装置、模型训练方法及装置能够保证等级判定准确性的前提下大大降低模型训练数据的数据量。
技术领域
本发明涉及故障检测技术领域,特别是涉及一种软件故障严重等级判定方法及装置、模型训练方法及装置。
背景技术
软件故障严重等级决定了故障修复的优先级,如果判定失误很可能会导致严重的故障没有及时修复,从而会导致软件质量差的严重后果。目前软件故障严重等级需要依赖人工进行判定,而人工判定故障的严重等级存在以下两方面的缺点:
人工判定故障的严重等级的准确性主要依赖人的经验,而经验欠缺的人员就会导致判定错误。不同人员对严重等级判定的标准理解容易存在差异,可能造成不同测试人员对同一问题的严重等级判定不同,影响软件产品质量评价的准确性。
由于大规模的软件的故障数量大,依赖人工判定故障等级效率低,会导致故障数据收集缓慢,会影响软件故障修复的进度。
如果采用预设的故障检测模型进行判断严重等级的自动判定,通常需要对进行等级判定的模型进行训练。这种训练通常需要一定量的标注数据,作为进行训练的训练数据。本领域技术人员应当清楚,在对模型进行训练之前需要对训练数据进行属性标注。这种标注工作费时费力,然而,为了保证模型输出结果的准确性又不得不进行这种费力的工作。
发明内容
本发明要解决的技术问题是提供一种软件故障严重等级判定方法及装置、模型训练方法及装置,能够保证等级判定准确性的前提下大大降低模型训练数据的数据量。
为解决上述技术问题,本发明提供了一种软件故障严重等级判定模型训练方法,所述方法包括:根据软件故障的故障数据,训练多个不同的基于最大熵理论的故障判断模型;根据软件故障的故障信息,训练多个不同的基于最大熵理论的故障判断模型,包括:获取各种软件故障的故障属性;将所述故障属性转换为故障特征向量;利用所述故障特征向量,训练多个基于最大熵理论的故障判断模型。
在一些实施方式中,获取到的不同种类的故障属性被赋予不同属性权重。
在一些实施方式中,摘要种类的故障属性被赋予属性权重3,发现时间种类的故障属性被赋予属性权重1,软件版本种类的故障属性被赋予属性权重1,描述种类的故障属性被赋予属性权重2,主题种类的故障属性被赋予属性权重2,注释种类的故障属性被赋予属性权重1。
在一些实施方式中,为了区别不同种类的属性中出现相同的词,将每个词前面加上故障属性名作为前缀。
在一些实施方式中,基于独热编码,将所述故障属性转换为故障特征向量,包括:判断是否需要对获取到的所述故障属性进行分词及去停用词;对通过分词获取到的词序列进行独热编码。
此外,本发明实施例还提供了一种软件故障严重等级判定方法,所述方法包括:利用多个基于最大熵理论的故障判断模型对故障进行实时预测;对多个所述故障判断模型的实时预测结果进行加权平均,得到对软件故障的故障等级判断。
在一些实施方式中,对多个所述故障判断模型的实时预测结果进行加权平均,得到对软件故障的故障等级判断,包括:根据如下计算公式进行加权平均,以得到对软件故障的故障等级判断:
其中,wi是模型i的权重,hi(x)是模型的预测结果。
在一些实施方式中,模型i的权重通过如下公式学习得到:
其中,模型i在测试数据集j中的准确率是cij。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电子科技集团公司第十五研究所,未经中国电子科技集团公司第十五研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910805751.3/2.html,转载请声明来源钻瓜专利网。