[发明专利]一种知识图谱自动构建方法及系统在审
申请号: | 202010702337.2 | 申请日: | 2020-07-20 |
公开(公告)号: | CN111858957A | 公开(公告)日: | 2020-10-30 |
发明(设计)人: | 袁琳;金忠孝 | 申请(专利权)人: | 上海汽车集团股份有限公司;上海汽车工业(集团)总公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F40/205;G06F40/295 |
代理公司: | 北京信远达知识产权代理有限公司 11304 | 代理人: | 赵兴华 |
地址: | 201203 上海市浦东新区*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 知识 图谱 自动 构建 方法 系统 | ||
本发明公开了一种知识图谱自动构建方法及系统,通过预先生成的对知识进行分粒度结构化抽象的第一信息表和第二信息表,约束各个知识类别的实例需要具备的属性及知识实例间可以存在和必须定义的关联关系,创建实例信息表,然后将结构化的数据导入图形数据库,生成知识结构与图形数据库的数据模型建的映射关系,最后自动将创建的实例信息表导入数据库中,生成领域知识图谱。经过图谱结构化,各知识实例之间通过关系直接关联或长路径的关系间接关联,使得汽车领域的知识具备统一的结构和语义关联,进而促进了知识的共享和重用。
技术领域
本发明涉及汽车领域知识处理技术领域,尤其涉及一种知识图谱自动构建方法及系统。
背景技术
目前,在汽车领域,由于各个企业对领域的相关知识认知、分类方式不同,且汽车的知识涉及动力、机械、电子等多个领域,以及涉及设计、制造、维修、销售等多种场景,以及知识一般分散于各种设计文档、专利文档和结构定义不同的表格、数据库之中,使得汽车领域没有一套标准化的知识分类和结构化组织方案。
因此,如何使得汽车领域的知识具备统一的结构和语义关联,进而促进知识的共享和重用,是一项亟待解决的问题。
发明内容
有鉴于此,本发明提供了一种知识图谱自动构建方法,能够通过构建的知识图谱使得汽车领域的知识具备统一的结构和语义关联,进而促进知识的共享和重用。
本发明提供了一种知识图谱自动构建方法,包括:
获取预先生成的第一信息表和第二信息表,其中,所述第一信息表和所述第二信息表具有相同的表头,均包括概念实体名称;
对所述第二信息表进行解析,生成实例信息表;
分别对所述第一信息表和所述第二信息表进行解析,生成所述第一信息表和所述第二信息表概念实体名称下每个概念实体对应的图形数据库的数据模型;
对所有所述实例信息表的每一行,分别调用概念实体对应的图形数据库的数据模型,生成知识图谱。
优选地,所述对所述第二信息表进行解析,生成实例信息表,包括:
按行顺序读取并解析所述第二信息表,每当概念实体不为空时,建立一个新的以当前的概念实体命名的实例信息表;
通过继承字段,获取所述当前的概念实体继承链上父概念所定义的属性和关系字段,加入列名称集合;
读取所述当前的概念实体所定义的属性和关系字段,加入列名称集合。
优选地,所述分别对所述第一信息表和所述第二信息表进行解析,生成所述第一信息表和所述第二信息表概念实体名称下每个概念实体对应的图形数据库的数据模型,包括:
按行顺序读取并解析所述第一信息表和所述第二信息表的每一行,每当概念实体不为空时,自动创建一个表示数据模型结构的类;
通过继承字段,确定所述表示数据模型结构的类所继承的已经存在的类;
对于概念实体的每一个属性及关系,根据对应的约束定义,在类中加入对应的类属性定义和约束。
优选地,所述对所有所述实例信息表的每一行,分别调用概念实体对应的图形数据库的数据模型,生成知识图谱,包括:
对所有所述实例信息表的每一行,分别调用概念实体对应的图形数据库的数据模型的类,实例化该类对象,为类的属性和关系赋值。
优选地,所述第一信息表的生成过程包括:
确定物理实体及物理实体间的关系、概念实体及概念实体间的关系和实体属性;
对实体进行归类,确定出的关系和属性,以及基于所述关系和属性确定出值域、值数目和存在性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海汽车集团股份有限公司;上海汽车工业(集团)总公司,未经上海汽车集团股份有限公司;上海汽车工业(集团)总公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010702337.2/2.html,转载请声明来源钻瓜专利网。