[发明专利]面向软件缺陷的领域知识图谱自动化构建方法有效
申请号: | 201810047681.5 | 申请日: | 2018-01-12 |
公开(公告)号: | CN108121829B | 公开(公告)日: | 2022-05-24 |
发明(设计)人: | 李斌;陈定山;孙小兵 | 申请(专利权)人: | 扬州大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F40/279 |
代理公司: | 南京中新达专利代理有限公司 32226 | 代理人: | 孙鸥;朱杰 |
地址: | 225009 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及面向软件缺陷的领域知识图谱自动化构建方法。本发明对bug缺陷关系三元组的抽取,再对bug缺陷领域的分类,即将bug缺陷库中bug相关信息进行收集并处理bug描述信息,通过自然语言处理得到描述句子中动词短语和名词短语,再根据bug信息相关的词与词之间依存关系,得出bug关系三元组,提取bug缺陷领域特征,采用半监督分类器进行训练、学习,使得分类器自动分类之前未被标记的三元组,将所有分类过的关系三元组存放在图形数据库中,构造出面向软件缺陷的领域知识图谱。本发明克服了在bug缺陷领域无有效处理方法的缺陷。本发明从自然语言处理角度,分析bug缺陷描述,帮助软件开发者和维护者更直观、快速、准确理解bug缺陷信息及其领域知识,提高效率,实现软件缺陷领域知识图谱,建立bug之间的关联关系。 | ||
搜索关键词: | 面向 软件 缺陷 领域 知识 图谱 自动化 构建 方法 | ||
【主权项】:
面向软件缺陷的领域知识图谱自动化构建方法,其特征在于步骤如下:(1)对相关bug缺陷库中的bug缺陷信息进行抓取,抓取bug报告中的BugID、缺陷描述信息以及平台、产品、组件、和状态四种主要属性,并进行自然语言处理,其中主要包含步骤:词语切分、词性标注;(2)根据自然语言处理过后句子中词的词性标注,利用短语识别的正则表达式识别出句子中的名词短语Noun Phrase即NP、动词短语Verb Phrase即VP和带有开放从句补语的动词短语VVP;(3)对bug缺陷描述信息进行依存句法分析,找出具体的“依赖”词和“主导”词之间的依存关系,提取出缺陷描述句子中的语法结构;(4)根据词与词之间的依存关系,并结合步骤(2)中提取到的NP与VP,构造出bug缺陷描述信息的关系三元组即NP1,VP,NP2,一个缺陷描述语句通常不止一个关系三元组;(5)对步骤(4)所提取到的bug缺陷描述信息的关系三元组进行补充,加入步骤(1)抓取到的bug缺陷信息中的BugID,最终生成关于bug缺陷的关系四元组即BugID,NP1,VP,NP2;(6)利用步骤(1)中采集的bug缺陷的属性X,构成bug缺陷的属性三元组即BugID,property,X,作为对bug信息的进一步描述,为之后的软件缺陷领域知识图谱的构建做准备;(7)根据之前所提取的三元组,提取bug缺陷分类的领域特征,借助于领域特征,促进下面的分类器学习训练过程;形如BugID,NP1,VP,NP2,features;(8)利用提取的特征,采用半监督SVM分类器进行学习、训练,并进行缺陷的领域分类;(9)分类器标记完成后,将标记到的各类bug缺陷数据存入到可视化数据库中,生成关于软件缺陷的领域知识图谱。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于扬州大学,未经扬州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810047681.5/,转载请声明来源钻瓜专利网。