[发明专利]一种基于人工智能的跨领域知识图谱构建方法及装置在审

专利信息
申请号: 202010198698.8 申请日: 2020-03-20
公开(公告)号: CN111428048A 公开(公告)日: 2020-07-17
发明(设计)人: 洪万福;王彬;周瑞 申请(专利权)人: 厦门渊亭信息科技有限公司
主分类号: G06F16/36 分类号: G06F16/36;G06F16/25
代理公司: 暂无信息 代理人: 暂无信息
地址: 361000 福建省厦门市思明*** 国省代码: 福建;35
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 人工智能 领域 知识 图谱 构建 方法 装置
【权利要求书】:

1.一种基于人工智能的跨领域知识图谱构建方法及装置,其特征在于,包括:知识模型,多源异构,知识数据抽取,跨领域本体融合;

所述知识模型指构建知识图谱的数据模型,通过TOVD构建方法进行本体构建,用以描述概念层次体系和知识库中知识的概念模板;

使用户清楚各种本体之间的关系,以及本体包含的标签和属性要素;

所述多源异构是指用于对来自于不同的信息源或者数据管理系统对其所包含的多方面特征进行充分的分析然后才能有效的对其进行融合操作;

所述知识数据抽取是面向开放的链接数据,通过自动化的技术抽取出可用的知识单元,知识单元主要包括实体(概念的外延)、关系以及属性等知识要素,并以此为基础,形成一系列高质量的事实表达,为模型层的构建奠定基础;

所述跨领域本体融合是指将多行业领域构建的本体库抽取进行融合,其中包括30+融合策略(实体链接,属性归一,冲突解决,知识补全,更新审核等内容)。

2.如权利要求1所述的一种基于人工智能的跨领域知识图谱构建方法及配置,其特征在于:

所述知识模型还包括:根据具体的应用领域和需要解决的问题以及实施过程进行分析,采用手工建模和半自动化建模针对全局本体库从多个行业领域的本体库出发,用以约束知识图谱数据的组织方式。

3.如权利要求1所述的一种基于人工智能的跨领域知识图谱构建方法及配置,其特征在于:

所述多源异构包括:支持多源异构的数据源管理,目前已支持的数据源类型主要有关系型数据源、分布式文件数据源、分布式hive数据源、分布式hbase数据源、非关系型数据源(mongodb)等,从这些数据源中提取实体关系和事件信息,并对这些信息进行计算生成新的标签和信息,同时需要能处理全量数据、增量数据;

异构性,在数据融合系统中进行融合处理的数据往往是来自于多个相互独立的系统产生的数据;

分布性,多源异构数据的数据源往往是异地分布的,有些数据之间的交互是通过网络传输的,存在网络传输性能和安全性等问题;

自治性:由于有些数据的来源可能是来自一些独立的系统,在这些相互独立的系统具有很强的自治性;

根据对多源异构数据融合的特征进行分析,融合系统中异构数据的主要表现分为语法异构和语义异构两种;

语法异构主要是指在领域内相同的对象和事实以不同的方式进行描述,

而语义异构主要出现在不同系统对相同信息做出了不一样的解释。

4.如权利要求1所述的一种基于人工智能的跨领域知识图谱构建方法及配置,其特征在于:

所述知识数据抽取还包括:结构化数据抽取中提供可视化的Schema设计器便于进行数据抽取和Schema结构更改;

支持单机/分布式存储的文件导入,非结构化抽取支持短文本、咨询、报道、制式公文等格式抽取;

半结构化抽取配合爬虫功能实现更强大的数据源抽取图谱功能;

实体的抽取:选择对应的数据源,建立科学完整的命名实体分类体系,基于归纳总结的实体类别和条件随机场模型进行实体边界识别,采用自适应感知机实现对实体的自动分类和统计机器学习的方法,从目标数据集中抽取出与之具有相似上下文特征的实体,从而实现实体的分类和聚类,用于自动补全技术,获取新出现的命名实体;

属性的抽取:是从不同信息源中采集特定实体的属性信息,分为预定义抽取和开放域抽取,如针对某个公众人物,可以从网络公开信息中得到其昵称、生日、国籍、教育背景等信息;

关系的抽取:经过实体抽取,得到的是一系列离散的命名实体,为了得到语义信息,还需要从相关语料中提取出实体之间的关联关系,通过关系将实体联系起来,形成网状的知识结构。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门渊亭信息科技有限公司,未经厦门渊亭信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010198698.8/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top