[发明专利]一种基于知识图谱的知识融合的方法和装置在审
申请号: | 202110989001.3 | 申请日: | 2021-08-26 |
公开(公告)号: | CN113722406A | 公开(公告)日: | 2021-11-30 |
发明(设计)人: | 洪万福 | 申请(专利权)人: | 厦门渊亭信息科技有限公司 |
主分类号: | G06F16/28 | 分类号: | G06F16/28;G06F16/35;G06F16/36 |
代理公司: | 北京鼎承知识产权代理有限公司 11551 | 代理人: | 王义刚;赖庆梧 |
地址: | 361000 福建省厦门市软*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 知识 图谱 融合 方法 装置 | ||
本发明公开了一种基于知识图谱的知识融合的方法和装置,该方法包括:通过基学习器建立各个被融合知识图谱的语义描述层与全局知识图谱的语义描述层之间的映射关系;通过元学习器对全部所述映射关系进行融合,获得融合语义描述层;将各个所述被融合知识图谱的数据导入到所述融合语义描述层,得到全部所述被融合知识图谱融合后的知识谱图。本发明可以同时对多个知识图谱进行映射融合,提高了效率,同时融合质量也更有保障。同时,可以解决跨语言知识图谱的知识融合问题。
技术领域
本发明涉及人工智能技术领域,特别涉及一种基于知识图谱的知识融合的方法和装置。
背景技术
随着知识图谱的应用日益广泛,已经在许多人工智能领域应用落地,如聊天机器人,智能问答,个性化推荐等。知识图谱在各个行业迅速落地,而在落地过程中,知识图谱的构建往往需要融合多种不同的数据源。在这个过程中往往会面临着如同一个实体在不同数据源中拥有着不同的描述方式等问题,从而造成的知识间的冲突。
发明内容
为了解决上述技术问题中的至少一个,本发明公开提供了一种基于知识图谱的知识融合的方法和装置。
第一方面,本发明提供了一种基于知识图谱的知识融合的方法,该方法包括:
通过基学习器建立各个被融合知识图谱的语义描述层与全局知识图谱的语义描述层之间的映射关系;
通过元学习器对全部所述映射关系进行融合,获得融合语义描述层;
将各个所述被融合知识图谱的数据导入到所述融合语义描述层,得到全部所述被融合知识图谱融合后的知识谱图。
可选地,所述被融合知识图谱的语义描述层包括知识图谱的分类体系,以及对知识图谱实体和关系的属性以及标签体系的定义,其中包含若干个实体和关系,所述实体数据包含id、属性和标签,所述关系包含id、类型和属性,其中所述实体的属性和所述关系的属性包括属性名称、数据类型、单位、格式和描述中的一个或多个。
可选地,所述实体的属性与所述关系的属性之间对应。
可选地,所述被融合知识图谱是依据其语义描述层对数据源进行知识抽取获得。
可选地,所述知识抽取包括:通过可视化技术对结构化、非结构化及半结构化数据进行知识抽取及数据映射。
可选地,所述数据源为结构化数据库时所述知识抽取包括D2R方式的数据映射。
可选地,所述知识抽取包括:从数据源中获取少量数据进行预抽取,对预抽取结果可视化展示;对所述预抽取结果进行检查,校验是否符合预期。
第二方面,本发明提供了一种基于知识图谱的知识融合的装置,该装置包括:映射获取模块、映射融合模块和谱图获取模块,其中,
所述映射获取模块,用于通过基学习器建立各个被融合知识图谱的语义描述层与全局知识图谱的语义描述层之间的映射关系;
所述映射融合模块,用于通过元学习器对全部所述映射关系进行融合,获得融合语义描述层;
所述谱图获取模块,用于将各个所述被融合知识图谱的数据导入到所述融合语义描述层,得到全部所述被融合知识图谱融合后的知识谱图。
可选地,所述被融合知识图谱的语义描述层包括知识图谱的分类体系,以及对知识图谱实体和关系的属性以及标签体系的定义,其中包含若干个实体和关系,所述实体数据包含id、属性和标签,所述关系包含id、类型和属性,其中所述实体的属性和所述关系的属性包括属性名称、数据类型、单位、格式和描述中的一个或多个。
可选地,所述实体的属性与所述关系的属性之间对应。
可选地,所述被融合知识图谱是依据其语义描述层对数据源进行知识抽取获得。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门渊亭信息科技有限公司,未经厦门渊亭信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110989001.3/2.html,转载请声明来源钻瓜专利网。