[发明专利]联邦知识图谱构建方法、系统、设备及存储介质在审
申请号: | 202210514582.X | 申请日: | 2022-05-12 |
公开(公告)号: | CN114780752A | 公开(公告)日: | 2022-07-22 |
发明(设计)人: | 汪河言;李金龙;刘攀;季江舟;贺瑶函 | 申请(专利权)人: | 招商银行股份有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/35;G06F16/957;G06N20/20 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 刘锡滨 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 联邦 知识 图谱 构建 方法 系统 设备 存储 介质 | ||
本申请公开了一种联邦知识图谱构建方法、系统、设备及存储介质,所述联邦知识图谱构建方法包括:获取目标领域的多源异构数据,并基于所述多源异构数据,生成各多源数据表,对各所述多源数据表进行归类分析,得到目标图谱信息,其中,所述目标图谱信息包括不同类型的图谱实体、实体属性、不同类型的图谱边以及边属性,基于所述目标图谱信息,生成不同的实体文件和边关系文件,基于所述不同的实体文件和边关系文件,构建目标联邦知识图谱。本申请解决了由于各类数据较为分散且数据间缺少关联,导致难以联合多方数据构建知识图谱的技术问题。
技术领域
本申请涉及互联网技术领域,尤其涉及一种联邦知识图谱构建方法、系统、设备及存储介质。
背景技术
知识图谱(Knowledge Graph),在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,在构建知识图谱过程中需要识别出各类数据的实体以及对应的关联关系,然而在大量金融行业应用场景中,因为缺少统一的知识框架,各类数据较为分散,并且数据间缺少关联,进而导致难以联合多方数据构建知识图谱。
发明内容
本申请的主要目的在于提供一种联邦知识图谱构建方法、系统、设备及存储介质,旨在解决现有技术中的由于各类数据较为分散且数据间缺少关联,导致难以联合多方数据构建知识图谱的技术问题。
为实现上述目的,本申请提供一种联邦知识图谱构建方法,所述联邦知识图谱构建方法包括:
获取目标领域的多源异构数据,并基于所述多源异构数据,生成各多源数据表;
对各所述多源数据表进行归类分析,得到目标图谱信息,其中,所述目标图谱信息包括不同类型的图谱实体、实体属性、不同类型的图谱边以及边属性;
基于所述目标图谱信息,生成不同的实体文件和边关系文件;
基于所述不同的实体文件和边关系文件,构建目标联邦知识图谱。
可选地,所述对所述多源数据表进行归类分析,得到目标图谱信息的步骤包括:
在所述多源数据表中,结合当前目标领域的业务场景,选取查询频次满足预设频次阈值的各目标字段作为所述不同类型的图谱实体,并确定各所述图谱实体对应的实体属性;
基于各所述图谱实体,在所述多源数据表中,选取关联相同类型图谱实体以及关联不同类型图谱实体的各目标字段作为所述不同类型的图普边,并确定各所述图谱边对应的边属性,其中,所述图谱边表征图谱实体之间的关联关系。
可选地,所述基于所述目标图谱信息,生成不同的实体文件和边关系文件的步骤包括:
根据所述目标图谱信息中不同图谱实体对应的目标字段,生成各所述实体文件;
以及根据所述目标图谱信息中不同图谱边对应的目标字段,生成各所述边关系文件。
可选地,所述基于所述多源异构数据,生成各多源数据表的步骤包括:
通过预设自然语言处理方法,对所述多源异构数据进行处理,生成各所述多源数据表。
可选地,在所述基于所述不同的实体文件和边关系文件,构建目标联邦知识图谱的步骤之后,还包括:
构建所述目标联邦知识图谱的可视化网页;
获取目标用户在所述可视化网页的操作指令;
在所述目标联邦知识图谱中查询所述操作指令对应的目标返回信息;
基于所述目标返回信息,通过预设绘制算法在所述可视化网页中进行可视化绘制。
可选地,所述基于所述目标返回信息,通过预设绘制算法进行可视化绘制,得到目标绘制图的步骤包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于招商银行股份有限公司,未经招商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210514582.X/2.html,转载请声明来源钻瓜专利网。