[发明专利]一种基于缺陷报告摘要中词性信息的严重程度预测方法有效
申请号: | 202110341218.3 | 申请日: | 2021-03-30 |
公开(公告)号: | CN113011179B | 公开(公告)日: | 2023-10-20 |
发明(设计)人: | 田丹;陈雪娇;林浩;陈翔;贾焱鑫;葛骅 | 申请(专利权)人: | 南通大学 |
主分类号: | G06F40/284 | 分类号: | G06F40/284;G06F40/237;G06F18/27;G06F18/241;G06N3/0464 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 朱小兵 |
地址: | 226019 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 缺陷 报告 摘要 词性 信息 严重 程度 预测 方法 | ||
本发明提供了一种基于缺陷报告摘要中词性信息的严重程度预测方法,通过使用较少数据量实现相近或更优的预测性能,并进一步地利用软件缺陷报告跟踪系统平台上存放的大型项目所含缺陷报告,进行快速且高准确性的软件缺陷报告严重程度的预测。本发明的有益效果为:本发明预测方法首先对缺陷报告中的摘要属性进行文本预处理,得到词根形式的分词;基于大规模文本语料库使用卷积神经网络模型训练,获得包含所属各分词词性和单词间相似度邻接矩阵的Spacy模型,进一步对分词进行筛选,随机抽取并生成相似数据扩充数据集,最终实现对缺陷报告严重程度的预测,相比于其他预测方法使用较少数据实现了更优性能。
技术领域
本发明涉及软件质量保障技术领域,尤其涉及一种基于缺陷报告摘要中词性信息的严重程度预测方法。
背景技术
开发者不可能开发出完全没有缺陷的项目,正如开发者不可能在发现一个缺陷以前意识到它的存在。正因如此,要充分保证项目的代码质量和用户体验,开发者就必须投入足够多的人力物力以确保每一个影响到代码质量或用户体验的缺陷都能够得到及时修复。为了更高效地跟踪和修复项目缺陷,目前行业内的通行做法是建立一个缺陷报告跟踪系统。用户将所认为的缺陷写成报告提交给缺陷报告跟踪系统,并按项目要求标注缺陷所对应的严重程度以便开发人员确定该缺陷修复的优先级,开发人员根据用户所提供的运行环境、复现步骤等信息确定是否存在缺陷并根据优先级进行修复作业。然而,在实际操作过程中,由于用户的经验、能力参差不齐,观察和考虑问题的角度不胜枚举,尽管有一些或约定俗成,或明文规定的提交规范,用户所提交的缺陷报告严重程度未必符合开发人员的标准,进而造成了缺陷修复的延误与人力物力的浪费。因此,借助机器学习等方法实现自动化的缺陷报告严重程度标注,便成了上佳之选。
软件缺陷报告的严重性主要包括Blocker、Critical、Major、Normal、Minor、Trivial和Enhancement七个级别,其中Normal级别由于是默认归类缺陷标签,在研究过程中往往会被归类为不可信缺陷,Blocker、Critical和Major级别的缺陷归类为严重缺陷,而其他级别的缺陷归类为非严重缺陷。
近年来在软件缺陷报告严重程度预测领域,大多数研究工作者在大规模或超大规模数据集的基础上,采用分类或回归的方法,通过使用缺陷报告的某些内容训练模型来实现对软件缺陷报告严重程度的预测。但在实际应用场景中,数据集质量参差不齐、数据集的规模难以保证等问题影响了预测模型性能的进一步提升。
发明内容
本发明的目的在于提供一种基于缺陷报告摘要中词性信息的严重程度预测方法,通过使用较少数据量实现相近或更优的预测性能,并进一步地利用软件缺陷报告跟踪系统平台上存放的大型项目所含缺陷报告,进行快速且高准确性的软件缺陷报告严重程度的预测。
本发明是通过如下措施实现的:一种基于缺陷报告摘要中词性信息的严重程度预测方法,包括如下步骤:
(1)从缺陷报告跟踪系统中,搜集已标记严重程度且严重程度为Blocker、Critical、Major、Minor、Trivial和Enhancement的缺陷报告,其中将严重程度为Blocker、Critical、Major的缺陷报告对应严重程度统一设置为“严重”类型,将严重程度为Minor、Trivial、Enhancement的缺陷报告对应严重程度统一设置为“不严重”类型,针对所搜集缺陷报告的摘要进行文本预处理,具体包括:分词、停顿词移除与词形还原,得到词根形式的分词;
(2)基于OntoNotes 5语料库、GloVe Common Crawl语料库和所述分词组成的大规模文本语料库,使用卷积神经网络模型进行训练,训练出Spacy模型;
(3)对各缺陷报告进行筛选提炼,得到初始数据集Dorg;
(4)针对所述初始数据集Dorg,进行数据集扩充,获得扩充后的训练数据集Dtrain;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南通大学,未经南通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110341218.3/2.html,转载请声明来源钻瓜专利网。