[发明专利]一种用于更新知识图谱的数据处理系统有效
申请号: | 202111540664.3 | 申请日: | 2021-12-16 |
公开(公告)号: | CN114168608B | 公开(公告)日: | 2022-07-15 |
发明(设计)人: | 傅晓航;张正义;林方;刘羽 | 申请(专利权)人: | 中科雨辰科技有限公司 |
主分类号: | G06F16/23 | 分类号: | G06F16/23;G06F16/22;G06F16/36 |
代理公司: | 北京锺维联合知识产权代理有限公司 11579 | 代理人: | 原春香 |
地址: | 100093 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 更新 知识 图谱 数据处理系统 | ||
本发明涉及一种用于更新知识图谱的数据处理系统,包括数据库、处理器和存储有计算机程序的存储器,当计算机程序被处理器执行时,实现步骤:获取多个中间字段名,遍历原始数据集且当所有中间字段名与任一原始数据列表的所有字段名均相等时,以基于预设本体架构,构建成目标知识图谱;当某一中间字段名与原始数据列表的所有字段名不相等时,从本体字段名列表中获取第一目标字段名列表和第二目标字段名列表,根据第一目标字段名列表和第二目标字段名列表,构建成目标知识图谱,本发明当原始数据进行更新时,只需要更新关键字段集和本体列表,就能够更新全部的知识图谱,优化知识图谱的更新过程,提高知识图谱的效率。
技术领域
本发明涉及计算机技术领域,尤其涉及一种用于更新知识图谱的数据处理系统。
背景技术
信息技术发展的时代,知识图谱(Knowl edge Graph)通常指可揭示实体之间的关系的语义网络,其基于数据挖掘、信息处理、图形绘制等手段,利用可视化的图谱将复杂的知识领域形象地展示出来,可在一定程度上体现知识领域的发展规律。
在现有技术中,基于每一数据的三元组构建成知识图谱,无法将相同类型实体的采用统一结构进行快速构建,即无法简化构建知识图谱过程,影响知识图谱的构建效率,同时也导致当数据更新时,只能重新构建三元组和知识图谱,因此,如何简化构建知识图谱过程,提高知识图谱的构建效率成为亟待解决的技术问题。
发明内容
本发明目的在于,提供一种用于更新知识图谱的数据处理系统,仅需要更新关键字段集和本体列表,完成知识图谱的更新,简化知识图谱的更新过程,提高知识图谱的效率。
本发明一方面提供了一种用于更新知识图谱的数据处理系统,所述系统包括:数据库、处理器和存储有计算机程序的存储器,其中,所述第一数据库中存储原始数据集和负样本列表,当所述计算机程序被处理器执行时,实现以下步骤:
S101、获取目标数据列表且根据所述目标数据列表中所有字段名作为中间字段名,构建成中间字段列表P=(P1,P2,P3,……,Pm),Pt是指第t个中间字段名,t=2……m,m为中间字段名数量;
S103、获取原始数据集Q=(Q1,Q2,Q3,……,QN),其中,Qz是指第z个原始数据列表,z=1……N,并遍历Q且当每一Pt与Q中任一Qz的所有字段名均相等时,以基于预设本体架构,构建成目标知识图谱;
S105、当某一Pt与Q中任一Qz的所有字段名不相等时,基于P和负样本列表,从所述本体字段名列表中获取第一目标字段名列表和第二目标字段名列表,其中,所述第一目标字段名列表为基于除Pt之前的其他中间字段名构建的列表,所述第二目标字段名列表为基于Pt构建的字段名列表;
S107、根据所述第一目标字段名列表以第一本体架构,得到第一目标三元组列表且根据所述第二目标字段名列表以第二本体架构,得到第二目标三元组列表,以根据第一目标三元组列表和第二目标三元组列表,构建成目标知识图谱。
本发明与现有技术相比具有明显的优点和有益效果。借由上述技术方案,本发明提供的一种用于更新知识图谱的数据处理系统可达到相当的技术进步性及实用性,并具有产业上的广泛利用价值,其至少具有下列优点:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中科雨辰科技有限公司,未经中科雨辰科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111540664.3/2.html,转载请声明来源钻瓜专利网。