[发明专利]一种知识图谱的创建方法、装置、存储介质和服务器在审

专利信息
申请号: 202011015057.0 申请日: 2020-09-24
公开(公告)号: CN112163098A 公开(公告)日: 2021-01-01
发明(设计)人: 杨健 申请(专利权)人: 平安直通咨询有限公司上海分公司
主分类号: G06F16/36 分类号: G06F16/36;G06F40/205
代理公司: 深圳中一联合知识产权代理有限公司 44414 代理人: 张全文
地址: 200040 上海*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 知识 图谱 创建 方法 装置 存储 介质 服务器
【说明书】:

本申请适用于计算机技术领域,提出一种知识图谱的创建方法、装置、存储介质和服务器。该知识图谱的创建方法包括:获取待创建知识图谱所属知识领域的材料文本;根据预先构建的图谱知识层schema对所述材料文本进行解析,提取实例要素数据;将提取出的实例要素数据和所述图谱知识层schema进行数据融合,得到垂直领域的第一知识图谱;从预设的知识图谱库中查找与所述第一知识图谱具有至少一个相关联图谱节点的其它知识图谱;以相关联的图谱节点为连接点,将所述第一知识图谱和所述其它知识图谱进行横向的融合,得到创建后的知识图谱。采用本申请提出的知识图谱的创建方法,能够提高知识图谱的创建效率。

技术领域

本申请属于计算机技术领域,尤其涉及一种知识图谱的创建方法、装置、存储介质和服务器。

背景技术

目前,知识图谱的创建过程主要包括:业务人员在Excel中梳理垂直领域的知识框架、节点、关系、三元组,输出Excel格式的知识层schema;将Excel格式的知识层schema交由建模人员,由建模人员编写代码,存储至图数据库;按照知识层schema线下加工并清洗数据,将非结构化、半结构化的数据加工成与知识层schema对应的结构化数据;建模人员编写代码将知识层schema与结构化的数据进行融合,生成完整的知识图谱。上述过程涉及大量的人工操作,知识图谱的创建效率较低。

发明内容

有鉴于此,本申请提出一种知识图谱的创建方法,能够提高知识图谱的创建效率。

第一方面,本申请实施例提供了一种知识图谱的创建方法,包括:

获取待创建知识图谱所属知识领域的材料文本;

根据预先构建的图谱知识层schema对所述材料文本进行解析,提取实例要素数据;

将提取出的实例要素数据和所述图谱知识层schema进行数据融合,得到垂直领域的第一知识图谱;

从预设的知识图谱库中查找与所述第一知识图谱具有至少一个相关联的图谱节点的其它知识图谱;

以相关联的图谱节点为连接点,将所述第一知识图谱和所述其它知识图谱进行横向的融合,得到创建后的知识图谱。

在本申请实施例中,用户只需要预先准备好待创建知识图谱的图谱知识层schema和相应的材料文本,系统会自动提取该材料文本中的实例要素数据,与图谱知识层进行融合,得到一个垂直领域的知识图谱;然后,会从知识图谱库中查找与该垂直领域的知识图谱具有至少一个相关联图谱节点的其它知识图谱,最后再将各个知识图谱进行横向的融合,得到最终创建好的知识图谱。通过这样设置,能够加快垂直领域知识图谱的构建进度,实现知识图谱构建过程中的知识编辑可视化、要素解析自动化、模型训练标准化、知识融合统一化,降低业务人员与模型开发人员的沟通成本,有效提高了知识图谱的创建效率。

进一步的,所述根据预先构建的图谱知识层schema对所述材料文本进行解析,提取实例要素数据可以包括:

对所述材料文本进行结构化数据的检测,找出所述材料文本包含的结构化数据以及非结构化数据;

采用预设的规则模型对所述结构化数据进行解析,得到其中包含的第一实例要素数据;

采用预先构建的NLP识别模型对所述非结构化数据进行解析,得到其中包含的第二实例要素数据;

将所述第一实例要素数据和所述第二实例要素数据进行融合,得到提取出的实例要素数据。

比如,对于姓名、性别、年龄等结构化程度较高的结构化数据,可以直接使用规则模型提取其中包含的实例要素数据。而对于非结构化数据,比如法律领域裁判文书中,要在某一案由下所有的裁判文书中抽取某一类别的争议焦点,则需要人工标注数据,训练NLP模型,再优化迭代,达到一定指标后,再进行解析,从而提取出非结构化数据中包含的实例要素数据。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安直通咨询有限公司上海分公司,未经平安直通咨询有限公司上海分公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011015057.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top