[发明专利]知识图谱的数据处理方法及服务器在审
申请号: | 201911155243.1 | 申请日: | 2019-11-22 |
公开(公告)号: | CN111026874A | 公开(公告)日: | 2020-04-17 |
发明(设计)人: | 陈维强;高雪松;蒋鹏民 | 申请(专利权)人: | 海信集团有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 李洪娟;刘芳 |
地址: | 266071 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 知识 图谱 数据处理 方法 服务器 | ||
1.一种知识图谱的数据处理方法,其特征在于,包括:
获取待处理原数据;
根据所述待处理原数据及当前知识图谱,确定所述待处理原数据是否在所述当前知识图谱中具有对应的实体;
若是,根据所述待处理原数据对所述当前知识图谱中对应的实体进行知识补全更新处理,获得新知识图谱;
若否,根据所述待处理原数据在所述当前知识图谱中新建对应的实体,并根据所述待处理原数据对新建的所述实体进行知识补全处理,获得新知识图谱。
2.根据权利要求1所述的方法,其特征在于,根据所述待处理原数据及当前知识图谱,确定所述待处理原数据是否在所述当前知识图谱中具有对应的实体,包括:
按行遍历所述待处理原数据,对于其中的每行数据,根据预设实体规则,判断其中需要建立实体的项;
对于每个需要建立实体的项,判断所述项在所述当前知识图谱中是否具有对应的实体。
3.根据权利要求2所述的方法,其特征在于,对于每个需要建立实体的项,判断所述项在所述当前知识图谱中是否具有对应的实体,包括:
获取所述项对应的唯一属性;
根据所述项对应的唯一属性,查询所述当前知识图谱中是否存在具有与所述唯一属性相同的属性且与所述项属于相同类型的实体;
若有,则表示所述项在所述当前知识图谱中存在对应的实体;
若无,则表示所述项在所述当前知识图谱中不存在对应的实体。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
获取所述项对应的唯一属性所对应的索引信息;
所述根据所述项对应的唯一属性,查询所述当前知识图谱中是否存在具有与所述唯一属性相同的属性且与所述项属于相同类型的实体,包括:
根据所述项对应的唯一属性及所述索引信息,查询所述当前知识图谱中是否存在具有与所述唯一属性相同的属性且与所述项属于相同类型的实体。
5.根据权利要求2所述的方法,其特征在于,所述方法还包括:
若根据所述待处理原数据确定第一实体和第二实体之间具有预设关系,则从所述新知识图谱中查询所述第一实体连接的各边所指向的第三实体;
根据各第三实体的唯一标识及所述第二实体的唯一标识,判断所述第一实体与所述第二实体之间是否存在对应的边;
若存在,则根据所述待处理原数据对所述第一实体与所述第二实体之间的边进行知识补全更新处理;
若不存在,则根据所述待处理原数据建立所述第一实体与所述第二实体之间的边,并进行知识补全处理。
6.根据权利要求5所述的方法,其特征在于,所述根据各第三实体的唯一标识及所述第二实体的唯一标识,判断所述第一实体与所述第二实体之间是否存在对应的边,包括:
若第三实体的唯一标识与所述第二实体的唯一标识相同,则确定所述第一实体与所述第二实体之间存在对应的边。
7.根据权利要求2所述的方法,其特征在于,所述按行遍历所述待处理原数据,对于其中的每行数据,根据预设实体规则,确定其中需要建立实体的项,包括:
按行遍历所述待处理原数据,并去掉不需要的表头内容;
对于其中需要的每行数据,根据预设实体规则,确定其中需要建立实体的项。
8.根据权利要求1所述的方法,其特征在于,所述获取待处理原数据,包括:
获取原始表格数据;
对所述原始表格数据进行预处理,获得预设格式的文本数据;
将所述预设格式的文本数据作为所述待处理原数据。
9.根据权利要求8所述的方法,其特征在于,所述对所述原始表格数据进行预处理,获得预设格式的文本数据,包括:
对于所述原始表格数据中字段内容为空的部分,采用预设特殊字进行填充处理,获得处理后表格数据;
采用分隔符&将所述表格数据转换成所述预设格式的文本数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于海信集团有限公司,未经海信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911155243.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种大米加工的高效净化过滤装置
- 下一篇:一种车库停车智能引导方法及系统