[发明专利]一种知识图谱的创建方法、装置、存储介质和服务器在审
申请号: | 202011015057.0 | 申请日: | 2020-09-24 |
公开(公告)号: | CN112163098A | 公开(公告)日: | 2021-01-01 |
发明(设计)人: | 杨健 | 申请(专利权)人: | 平安直通咨询有限公司上海分公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F40/205 |
代理公司: | 深圳中一联合知识产权代理有限公司 44414 | 代理人: | 张全文 |
地址: | 200040 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 知识 图谱 创建 方法 装置 存储 介质 服务器 | ||
本申请适用于计算机技术领域,提出一种知识图谱的创建方法、装置、存储介质和服务器。该知识图谱的创建方法包括:获取待创建知识图谱所属知识领域的材料文本;根据预先构建的图谱知识层schema对所述材料文本进行解析,提取实例要素数据;将提取出的实例要素数据和所述图谱知识层schema进行数据融合,得到垂直领域的第一知识图谱;从预设的知识图谱库中查找与所述第一知识图谱具有至少一个相关联图谱节点的其它知识图谱;以相关联的图谱节点为连接点,将所述第一知识图谱和所述其它知识图谱进行横向的融合,得到创建后的知识图谱。采用本申请提出的知识图谱的创建方法,能够提高知识图谱的创建效率。
技术领域
本申请属于计算机技术领域,尤其涉及一种知识图谱的创建方法、装置、存储介质和服务器。
背景技术
目前,知识图谱的创建过程主要包括:业务人员在Excel中梳理垂直领域的知识框架、节点、关系、三元组,输出Excel格式的知识层schema;将Excel格式的知识层schema交由建模人员,由建模人员编写代码,存储至图数据库;按照知识层schema线下加工并清洗数据,将非结构化、半结构化的数据加工成与知识层schema对应的结构化数据;建模人员编写代码将知识层schema与结构化的数据进行融合,生成完整的知识图谱。上述过程涉及大量的人工操作,知识图谱的创建效率较低。
发明内容
有鉴于此,本申请提出一种知识图谱的创建方法,能够提高知识图谱的创建效率。
第一方面,本申请实施例提供了一种知识图谱的创建方法,包括:
获取待创建知识图谱所属知识领域的材料文本;
根据预先构建的图谱知识层schema对所述材料文本进行解析,提取实例要素数据;
将提取出的实例要素数据和所述图谱知识层schema进行数据融合,得到垂直领域的第一知识图谱;
从预设的知识图谱库中查找与所述第一知识图谱具有至少一个相关联的图谱节点的其它知识图谱;
以相关联的图谱节点为连接点,将所述第一知识图谱和所述其它知识图谱进行横向的融合,得到创建后的知识图谱。
在本申请实施例中,用户只需要预先准备好待创建知识图谱的图谱知识层schema和相应的材料文本,系统会自动提取该材料文本中的实例要素数据,与图谱知识层进行融合,得到一个垂直领域的知识图谱;然后,会从知识图谱库中查找与该垂直领域的知识图谱具有至少一个相关联图谱节点的其它知识图谱,最后再将各个知识图谱进行横向的融合,得到最终创建好的知识图谱。通过这样设置,能够加快垂直领域知识图谱的构建进度,实现知识图谱构建过程中的知识编辑可视化、要素解析自动化、模型训练标准化、知识融合统一化,降低业务人员与模型开发人员的沟通成本,有效提高了知识图谱的创建效率。
进一步的,所述根据预先构建的图谱知识层schema对所述材料文本进行解析,提取实例要素数据可以包括:
对所述材料文本进行结构化数据的检测,找出所述材料文本包含的结构化数据以及非结构化数据;
采用预设的规则模型对所述结构化数据进行解析,得到其中包含的第一实例要素数据;
采用预先构建的NLP识别模型对所述非结构化数据进行解析,得到其中包含的第二实例要素数据;
将所述第一实例要素数据和所述第二实例要素数据进行融合,得到提取出的实例要素数据。
比如,对于姓名、性别、年龄等结构化程度较高的结构化数据,可以直接使用规则模型提取其中包含的实例要素数据。而对于非结构化数据,比如法律领域裁判文书中,要在某一案由下所有的裁判文书中抽取某一类别的争议焦点,则需要人工标注数据,训练NLP模型,再优化迭代,达到一定指标后,再进行解析,从而提取出非结构化数据中包含的实例要素数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安直通咨询有限公司上海分公司,未经平安直通咨询有限公司上海分公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011015057.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于碗状注塑用品的手动削批锋装置
- 下一篇:一种供暖设备及其控制方法