[发明专利]面向软件缺陷的领域知识图谱自动化构建方法有效
申请号: | 201810047681.5 | 申请日: | 2018-01-12 |
公开(公告)号: | CN108121829B | 公开(公告)日: | 2022-05-24 |
发明(设计)人: | 李斌;陈定山;孙小兵 | 申请(专利权)人: | 扬州大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F40/279 |
代理公司: | 南京中新达专利代理有限公司 32226 | 代理人: | 孙鸥;朱杰 |
地址: | 225009 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 面向 软件 缺陷 领域 知识 图谱 自动化 构建 方法 | ||
1.面向软件缺陷的领域知识图谱自动化构建方法,其特征在于步骤如下:
(1)对相关bug缺陷库中的bug缺陷信息进行抓取,抓取bug报告中的BugID、缺陷描述信息以及平台、产品、组件、和状态四种属性,并进行自然语言处理,其中包含步骤:词语切分、词性标注;
(2)根据自然语言处理过后句子中词的词性标注,利用短语识别的正则表达式识别出句子中的名词短语Noun Phrase即NP、动词短语Verb Phrase即VP和带有开放从句补语的动词短语VVP;
(3)对bug缺陷描述信息进行依存句法分析,找出具体的“依赖”词和“主导”词之间的依存关系,提取出缺陷描述句子中的语法结构;
(4)根据词与词之间的依存关系,并结合步骤(2)中提取到的NP与VP,构造出bug缺陷描述信息的关系三元组即NP1,VP,NP2,一个缺陷描述语句不止一个关系三元组;其中,NP1表示该关系三元组中第一个名词短语,NP2表示该关系三元组中第二个名词短语;
(5)对步骤(4)所提取到的bug缺陷描述信息的关系三元组进行补充,加入步骤(1)抓取到的bug缺陷信息中的BugID,最终生成关于bug缺陷的关系四元组即BugID,NP1,VP,NP2;
(6)利用步骤(1)中采集的bug缺陷的属性X,构成bug缺陷的属性三元组即BugID,property,X,作为对bug信息的进一步描述,为之后的软件缺陷领域知识图谱的构建做准备;其中,X是指当前bug的具体属性,为平台、产品、组件和状态四种属性中的一种,property表示当前BugID和X是属性的关系;
(7)根据之前所提取的属性三元组和关系四元组,提取bug缺陷分类的领域特征,借助于领域特征,促进下面的分类器学习训练过程;
(8)利用提取的特征,采用半监督SVM分类器进行学习、训练,并进行缺陷的领域分类;
(9)分类器标记完成后,将标记到的各类bug缺陷数据存入到可视化数据库中,生成关于软件缺陷的领域知识图谱。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于扬州大学,未经扬州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810047681.5/1.html,转载请声明来源钻瓜专利网。