[发明专利]开源软件开发中假设条件识别与抽取方法及系统在审
申请号: | 202211501480.0 | 申请日: | 2022-11-28 |
公开(公告)号: | CN115756573A | 公开(公告)日: | 2023-03-07 |
发明(设计)人: | 杨晨;马梓南;刘小华;张喜生 | 申请(专利权)人: | 深圳职业技术学院 |
主分类号: | G06F8/70 | 分类号: | G06F8/70;G06F8/71;G06F16/2458;G06F16/248;G06F16/28 |
代理公司: | 深圳市壹壹壹知识产权代理事务所(普通合伙) 44521 | 代理人: | 库水龙 |
地址: | 518000 广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 软件 开发 假设 条件 识别 抽取 方法 系统 | ||
1.一种开源软件开发中假设条件识别与抽取方法,其特征在于,包括:
建模步骤:建立数据仓库模型、数据仓库版本发布模型、拉取请求模型、提交模型、问题模型;
数据源配置步骤:根据数据仓库模型和数据仓库版本发布模型,采集数据源信息并保存;
采集拉取请求数据步骤:根据拉取请求模型采集并解析数据源的拉取请求数据,计算已采集数据数量,将采集记录及采集的数据保存入数据库;
采集提交数据步骤:根据提交模型采集并解析数据源提交相关的数据,计算已采集数据数量,将采集记录及采集的数据保存入数据库;
采集问题数据步骤:根据问题模型采集数据源问题相关的数据,计算已采集数据数量,将采集记录及采集的数据保存入数据库;
假设条件检索步骤:根据用户所指定的数据仓库、数据类型、检索范围以及假设条件检索词在数据库内检索假设条件数据,展示检索结果,并在检索结果中高亮检索词;
假设条件提取步骤:创建正常数据列表和异常数据列表,遍历假设条件检索步骤中的检索结果,提取异常句子的特征;对于每一条假设条件检索结果,提取检索词所在句子,如果该检索词所在句子特征符合异常句子特征,则存入异常数据列表,否则存入正常数据列表;将正常数据列表和异常数据列表分别提取至两个文件保存,正常数据列表的文件包含两列:检索词上下文、检索词所在句子;异常数据列表的文件包含三列:检索词上下文、检索词所在句子、异常信息。
2.如权利要求1所述的开源软件开发中假设条件识别与抽取方法,其特征在于,假设条件提取步骤之后还包括:
构建假设条件静态知识图谱步骤:根据用户所指定的数据仓库以及假设条件检索词,针对该数据仓库,构建一张以头实体、关系、尾实体为基本结构构造的假设条件静态知识图谱,该知识图谱中的实体包括该数据仓库中含有假设条件的拉取请求、提交和问题;
构建假设条件时序知识图谱步骤:根据用户所指定的数据仓库、时间维度,针对每个时间段,将静态知识图谱扩展为以头实体、关系、尾实体、时间信息为基本结构构造的时序知识图谱,该知识图谱中的实体包括该数据仓库在特定时刻含有假设条件的拉取请求、提交、问题;该时序知识图谱中,识别不同时刻的相同实体以及不同时刻的不同但存在关系的实体,将这些实体连接。
3.如权利要求1所述的开源软件开发中假设条件识别与抽取方法,其特征在于,数据仓库模型的模型元素包括数据仓库的基本描述、涉众、状态、时间、配置、分支、拉取和推送请求、提交、问题、标签以及版本发布信息;
数据仓库版本发布模型的模型元素包括版本的名称、作者、描述、URL、标签、状态、创建时间、更新时间、发布时间、数据库ID、用户列表、资源、所属数据仓库信息;
拉取请求模型的模型元素包括拉取请求的基础信息、涉众、状态、时间、文件、检测和评审、关系描述、标签、附言;
提交模型的模型元素包括提交的基础信息、涉众、状态、时间、提交结构、文件、关系描述;
问题模型的模型元素包括问题的基础信息、涉众、状态、时间、关系描述、修改记录、标签、回复。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳职业技术学院,未经深圳职业技术学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211501480.0/1.html,转载请声明来源钻瓜专利网。