[发明专利]一种用于更新知识图谱的数据处理系统有效
申请号: | 202111540664.3 | 申请日: | 2021-12-16 |
公开(公告)号: | CN114168608B | 公开(公告)日: | 2022-07-15 |
发明(设计)人: | 傅晓航;张正义;林方;刘羽 | 申请(专利权)人: | 中科雨辰科技有限公司 |
主分类号: | G06F16/23 | 分类号: | G06F16/23;G06F16/22;G06F16/36 |
代理公司: | 北京锺维联合知识产权代理有限公司 11579 | 代理人: | 原春香 |
地址: | 100093 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 更新 知识 图谱 数据处理系统 | ||
1.一种用于更新知识图谱的数据处理系统,其特征在于,所述系统包括:数据库、处理器和存储有计算机程序的存储器,其中,所述数据库中存储原始数据集合和负样本列表,当所述计算机程序被处理器执行时,实现以下步骤:
S101、获取目标数据列表且将所述目标数据列表中所有字段名作为中间字段名,构建成中间字段列表P=(P1,P2,P3,……,Pm),Pt是指第t个中间字段名,t=2……m,m为中间字段名数量;
S103、获取原始数据集Q=(Q1,Q2,Q3,……,QN),其中,Qz是指第z个原始数据列表,z=1……N,并遍历Q且当每一Pt与Q中任一Qz的所有字段名均相等时,以基于预设本体架构,构建成目标知识图谱;其中,在S103步骤中,获取Qz中所有原始字段名且根据任一所述原始字段名,从本体字段名列表中获取所述原始字段名对应的关联数据和从A中获取原始字段名的第一记录和第二记录,以建立预设本体架构;S105、当某一Pt与Q中任一Qz的所有字段名不相等时,基于P和负样本列表,从本体字段名列表中获取第一目标字段名列表和第二目标字段名列表,其中,所述第一目标字段名列表为基于除Pt之前的其他中间字段名构建的列表,所述第二目标字段名列表为基于Pt构建的字段名列表;
S107、根据所述第一目标字段名列表以第一本体架构,得到第一目标三元组列表且根据所述第二目标字段名列表以第二本体架构,得到第二目标三元组列表,以根据第一目标三元组列表和第二目标三元组列表,构建成目标知识图谱;
其中,当原始数据进行更新时,更新关键字段集和本体列表以更新全部的知识图谱。
2.根据权利要求1所述的用于更新知识图谱的数据处理系统,其特征在于,所述目标数据列表是在原始数据集中增加的原始数据列表。
3.根据权利要求1所述的用于更新知识图谱的数据处理系统,其特征在于,还通过如下步骤确定本体字段列表:
基于所述字段名字列表中任一字段进行预处理,得到目标关键列表A0;
基于A0,确定出M个关键字段列表,以根据A0和M个关键字段列表,构建成关键字段集A=(A0,A1,A2,……,AM),Ai是第i个关键字段列表且Ai中包括第一关键字段和第二关键字段,i=1……M;
基于每一Ai的第一关键字段和第二关键字段,从所述字段名列表中删除Ai的第一关键字段和Ai的第二关键字段,构建成本体字段名列表,其中,所述第一关键字段与所述第二关键字段之间存在关联关系。
4.根据权利要求3所述的用于更新知识图谱的数据处理系统,其特征在于,还通过如下步骤确定字段名列表:
基于每一所述原始数据列表中所有原始字段名和负样本列表,获取字段名列表,所述字段名列表包括第一字段和第二字段,其中,所述第一字段与所述第二字段之间具有关联关系。
5.根据权利要求4所述的用于更新知识图谱的数据处理系统,其特征在于,所述原始字段名为在原始数据表中每一字段对应的字段名。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中科雨辰科技有限公司,未经中科雨辰科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111540664.3/1.html,转载请声明来源钻瓜专利网。