[发明专利]一种知识图谱的更新方法、装置、电子设备及存储介质有效
申请号: | 201910549693.2 | 申请日: | 2019-06-24 |
公开(公告)号: | CN110275894B | 公开(公告)日: | 2021-12-14 |
发明(设计)人: | 张绍震;应雄;姜海军;楼承先;马佳军;赵晨煜 | 申请(专利权)人: | 恒生电子股份有限公司 |
主分类号: | G06F16/23 | 分类号: | G06F16/23;G06F16/28 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 杨华 |
地址: | 310053 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 知识 图谱 更新 方法 装置 电子设备 存储 介质 | ||
1.一种知识图谱的更新方法,其特征在于,包括:
获取预先建立的本体模型,以及获取依据属于所述本体模型的知识三元组形成的知识图谱;
在目标知识三元组中存在满足预设条件的知识三元组的情况下,将满足所述预设条件的知识三元组所对应的本体作为目标本体,并将满足所述预设条件的知识三元组所对应的本体关系作为目标本体关系;所述目标知识三元组为从结构化数据,和/或,非结构化数据中提取的属于预设领域的知识三元组;所述预设条件至少包括:对应的本体与本体关系不属于所述本体模型;
将所述目标本体与所述目标本体关系添加到所述本体模型,得到更新后的本体模型,所述更新后的本体模型的结构和预先建立的本体模型的结构不同,所述更新后的本体模型具有信息丰富并且包含预设领域的最新信息的特点;
至少从预设的结构化数据中,提取属于所述更新后的本体模型的知识三元组;
采用属于所述更新后的本体模型的知识三元组,更新所述知识图谱;
根据所述更新后的本体模型中的本体及本体关系,遍历更新后的知识图谱,确定所述更新后的知识图谱中缺失的信息;
获取依据所述缺失的信息所制定的第三采集策略,所述第三采集策略包括数据类型、数据来源、目标字段、约束条件和知识获取方式;
采集满足所述第三采集策略的知识三元组;
在采集到满足所述第三采集策略的知识三元组的情况下,采用满足所述第三采集策略的知识三元组,对所述更新后的知识图谱进行更新。
2.根据权利要求1所述的方法,其特征在于,所述至少从预设的结构化数据中,提取属于所述更新后的本体模型的知识三元组,包括:
获取预设的第一采集策略;所述第一采集策略依据所述更新后的本体模型中的本体与本体关系建立,且所述第一采集策略用于采集属于所述更新后的本体模型的知识三元组;
从所述预设的结构化数据中采集满足所述第一采集策略的知识三元组为第一知识三元组;
将所述第一知识三元组作为属于所述更新后的本体模型的知识三元组。
3.根据权利要求2所述的方法,其特征在于,在所述将所述第一知识三元组作为属于所述更新后的本体模型的知识三元组之前,还包括:
获取预设的第二采集策略;所述第二采集策略用于确定属于所述预设领域的知识三元组;
从预设的非结构化数据中,采集满足所述第二采集策略的知识三元组为第二知识三元组;
从所述第二知识三元组中,确定属于所述更新后的本体模型的知识三元组为第三知识三元组;
所述将所述第一知识三元组作为属于所述更新后的本体模型的知识三元组,具体为:将所述第一知识三元组与所述第三知识三元组,作为属于所述更新后的本体模型的知识三元组。
4.根据权利要求3所述的方法,其特征在于,在将所述第一知识三元组与所述第三知识三元组,作为属于所述更新后的本体模型的知识三元组之前,还包括:
从所述第一知识三元组中,确定置信度大于预设的第一置信度阈值的第一知识三元组为第一目标知识三元组;针对任一所述第一知识三元组,该第一知识三元组的置信度为该第一知识三元组所来源于的结构化数据的置信度;
从所述第二知识三元组中,确定置信度大于预设的第二置信度阈值的第二知识三元组为第二目标知识三元组;针对任一所述第二知识三元组,该第二知识三元组的置信度为:该第二知识三元组的出现的次数与该第二知识三元组所来源于的非结构化数据的置信度间的加权和;该第二知识三元组的出现的次数为:从所述非结构化数据进行一次采集所得到的满足所述第二采集策略的知识三元组中,该第二知识三元组出现的次数;
所述从所述第二知识三元组中,确定属于所述更新后的本体模型的知识三元组为第三知识三元组,具体为:
从所述第二目标知识三元组中,确定属于所述更新后的本体模型的知识三元组为第三目标知识三元组;
所述将所述第一知识三元组与所述第三知识三元组,作为属于所述更新后的本体模型的知识三元组,具体为:
将所述第一目标知识三元组与所述第三目标知识三元组,作为属于所述更新后的本体模型的知识三元组。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于恒生电子股份有限公司,未经恒生电子股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910549693.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数据操作方法及装置
- 下一篇:一种缺失交通数据的填充设备、装置及方法