[发明专利]一种基于异质信息网络的重复缺陷报告检测方法有效
申请号: | 202010413134.1 | 申请日: | 2020-05-15 |
公开(公告)号: | CN111737107B | 公开(公告)日: | 2021-10-26 |
发明(设计)人: | 肖冠平;郑征;杜晓婷 | 申请(专利权)人: | 南京航空航天大学;北京航空航天大学 |
主分类号: | G06F11/36 | 分类号: | G06F11/36;G06F40/194;G06K9/62;G06F40/30;G06N3/04;G06N3/08 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 柏尚春 |
地址: | 210016 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 信息网络 重复 缺陷 报告 检测 方法 | ||
1.一种基于异质信息网络的重复缺陷报告检测方法,其特征在于,包括以下步骤:
(1)从缺陷报告文件中提取结构化的异质属性当作节点,根据异质属性节点之间的关系构建缺陷报告异质信息网络;
(2)对建立的缺陷报告异质信息网络进行网络表示学习,得到每个属性节点的向量表示;
(3)从缺陷报告文件中提取文本信息并进行预处理,然后使用大量的无标签的缺陷报告文本信息训练缺陷报告文本语义模型,得到缺陷报告文本中每个单词的向量表示;
(4)从缺陷仓库中识别缺陷报告组,同一个缺陷报告组中的缺陷报告描述相同的失效现象;
(5)从步骤(4)中识别的缺陷报告组中生成重复和非重复缺陷报告对数据;并将该数据划分成训练、验证和测试数据;
(6)将步骤(2)、(3)中的得到的异质属性节点向量和文本单词向量分别用于表示缺陷报告的结构化特征和非结构化特征,用于构建重复缺陷报告检测模型;
(7)使用步骤(5)中得到的训练和验证数据对步骤(6)建立的重复缺陷报告检测模型进行训练;
(8)使用步骤(7)中训练得到的重复缺陷报告检测模型对测试数据进行自动检测,得到重复缺陷报告的检测结果。
2.根据权利要求1所述的一种基于异质信息网络的重复缺陷报告检测方法,其特征在于,所述步骤(1)包括以下步骤:
(11)从缺陷报告文件中提取六类异质属性当作节点,即缺陷报告标识号BID、产品PRO、组件COM、版本VER、严重性SEV和修复优先级PRI;
(12)将六类属性节点建立连边:
每个缺陷报告记录一个位于特定软件项目功能组件的缺陷,分别使用L和L-1来表示缺陷报告和组件之间的关系R1,即和
每个组件属于一个产品,分别使用B和B-1来表示组件和产品之间的关系R2,即和
描述一个缺陷出现在一个具体的版本,使用O和O-1来表示缺陷报告与版本之间的关系R3,即和
每个缺陷报告都有一个开发者处理的优先级,分别使用H和H-1来表示缺陷报告与修复优先级之间的关系R4,即和
每个缺陷报告都会对用户有一定程度的严重性影响,分别使用I和I-1来表示缺陷报告与严重性之间的关系R5,即和
3.根据权利要求1所述的一种基于异质信息网络的重复缺陷报告检测方法,其特征在于,步骤(3)中所述的预处理包括单词分割、停用词删除和单词标准化。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京航空航天大学;北京航空航天大学,未经南京航空航天大学;北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010413134.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:作品排序方法、装置和存储介质
- 下一篇:作用于输送带上的电路板翻转设备