[发明专利]一种知识图谱自动嵌入的方法及系统在审
申请号: | 202110807811.2 | 申请日: | 2021-07-16 |
公开(公告)号: | CN113505242A | 公开(公告)日: | 2021-10-15 |
发明(设计)人: | 陈海林;张蓬;赵绪龙 | 申请(专利权)人: | 珍岛信息技术(上海)股份有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/35;G06F16/332 |
代理公司: | 合肥正则元起专利代理事务所(普通合伙) 34160 | 代理人: | 匡立岭 |
地址: | 200000 上海市静安区*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 知识 图谱 自动 嵌入 方法 系统 | ||
本发明公开了一种知识图谱自动嵌入的方法及系统,属于知识图谱领域,涉及抽象建模技术,解决了现阶段用户获取企业产业属性相关的图谱信息与统计信息,可以快速高效的让用户获取和了解企业上下游及产业链信息。通过机器学习将外部数据源与企业数据库中的企业信息相关联匹配,生成所需的企业属性与企业实体,并将企业产品产业链关系图谱更直观的展示出来。可以让用户更好的更快的获取企业关联信息。当用户输入与企业相关的关键词,通过添加补充限制条件,可以展现图谱信息和统计信息,进一步展现用户最关心的企业和产品信息,减少素材收集与检索了解时间。
技术领域
本发明属于知识图谱领域,涉及抽象建模技术,具体是一种知识图谱自动嵌入的方法及系统。
背景技术
知识图谱(Knowledge Graph),在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。知识图谱,是通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合,并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构达到多学科融合目的的现代理论。
现阶段的用户难以通过知识图谱获取企业产业属性相关的图谱信息与统计信息,且在获取时难以获取得到企业上下游及产业链信息更不能直观的展现出来。
为此提出一种知识图谱自动嵌入的方法及系统。
发明内容
本发明提供了一种知识图谱自动嵌入的方法及系统,解决了现阶段用户获取企业产业属性相关的图谱信息与统计信息,可以快速高效的让用户获取和了解企业上下游及产业链信息。通过机器学习将外部数据源与企业数据库中的企业信息相关联匹配,生成所需的企业属性与企业实体,并将企业产品产业链关系图谱更直观的展示出来。可以让用户更好的更快的获取企业关联信息。
本发明的目的可以通过以下技术方案实现:
一种知识图谱自动嵌入系统,包括企业数据库、数据采集端、数据处理模块、知识建模模块、可视化模块、图谱服务模块以及信息查询模块;
所述企业数据库用于存储企业信息以及企业对应的产品信息;
所述知识建模模块用于根据企业数据库内存储的企业信息以及产品信息进行建立知识图谱;
所述数据采集端用于实现企业信息以及产品信息的提取;
所述数据处理模块用于对数据采集端提取的信息进行处理;
所述图谱服务模块用于辅助完成知识图谱的建立;
所述可视化模块用于用户通过信息查询模块进行信息查询时进行可视化显示。
进一步地,所述企业信息包括企业所属行业、节点属性和企业标签。
进一步地,知识建模模块进行知识图谱的建立过程包括:
数据采集端从企业数据库内提取企业数据,并将企业数据发送至数据处理模块进行处理;
知识建模模块确定节点属性或标签;
确定关联关系;
通过节点链接技术,实现围绕节点的多种类型数据的关联存储;
采用平移距离模型、语义匹配模型等向量嵌入方法和评分函数,实现图谱的自动嵌入。
进一步地,节点确定的过程包括:
多源数据融合:根据企业数据库内的数据,确定企业行业的分组,并根据行业分组对属性计算编辑距离和Jaccard相似性;
对文档通过tf-idf找出关键词,再通过余弦相似度计算文档的相似程度;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于珍岛信息技术(上海)股份有限公司,未经珍岛信息技术(上海)股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110807811.2/2.html,转载请声明来源钻瓜专利网。