[发明专利]一种基于多规则的知识图谱动态生成方法在审
申请号: | 201811636257.0 | 申请日: | 2018-12-29 |
公开(公告)号: | CN109710775A | 公开(公告)日: | 2019-05-03 |
发明(设计)人: | 徐汕;梁炬;黄文锋;张晶亮;单酉;杨端;卫未 | 申请(专利权)人: | 北京航天云路有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36 |
代理公司: | 北京纽乐康知识产权代理事务所(普通合伙) 11210 | 代理人: | 白明珠 |
地址: | 100039 北京市海淀区西*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种基于多规则的知识图谱动态生成方法,包括以下步骤:加载原始数据;将原始数据的格式解析并转化生成为datarow格式;获取相应的本体文件;将每个本体文件的数据内容按照相应的处理规则通过RDF三元组生成方法生成RDF文件;将生成的RDF文件进行解析存储,在存储过程中,形成知识图谱。在知识图谱生成的过程中可根据不同的数据源或本体文件加载相应一个或者是多个处理规则,在一次处理流程中可以动态的根据多种规则生成知识图谱。提高多源异构数据统一处理的能力。 | ||
搜索关键词: | 图谱 处理规则 动态生成 原始数据 多源异构数据 存储过程 方法生成 格式解析 规则生成 数据内容 统一处理 文件加载 一次处理 动态的 三元组 数据源 加载 解析 存储 转化 | ||
【主权项】:
1.一种基于多规则的知识图谱动态生成方法,其特征在于,包括以下步骤:S1加载原始数据,所述原始数据包括数据源ID以及若干本体文件;S2将所述原始数据的格式解析并转化生成为datarow格式,转化后的所述原始数据中,其本体文件的数据内容通过键值对的形式与本体ID相对应,所述数据内容包括若干实体以及每个所述实体所对应的属性;S3根据所述数据源ID及规则映射表获取若干所述本体ID,再根据所述本体ID获取相应的所述本体文件;S4将每个所述本体文件的数据内容按照相应的处理规则通过RDF三元组生成方法生成RDF文件,从而得到每个所述本体文件中若干所述实体之间的关系;S5将生成的所述RDF文件进行解析存储,在存储过程中,按照所述关系对不同所述本体文件中的所述实体进行关联,从而形成知识图谱。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航天云路有限公司,未经北京航天云路有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811636257.0/,转载请声明来源钻瓜专利网。
- 上一篇:结合平衡策略的图数据划分与分布式存储方法
- 下一篇:相册的知识图谱的构建方法