[发明专利]一种基于wikidata的知识体系自动构建方法与系统有效
申请号: | 201911356255.0 | 申请日: | 2019-12-25 |
公开(公告)号: | CN111177406B | 公开(公告)日: | 2023-09-26 |
发明(设计)人: | 毛彬;罗威;谭玉珊;罗准辰;田昌海;叶宇铭;宋宇 | 申请(专利权)人: | 中国人民解放军军事科学院军事科学信息研究中心 |
主分类号: | G06F16/36 | 分类号: | G06F16/36 |
代理公司: | 北京方安思达知识产权代理有限公司 11472 | 代理人: | 陈琳琳;刘振 |
地址: | 100142*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 wikidata 知识 体系 自动 构建 方法 系统 | ||
1.一种基于wikidata的知识体系自动构建方法,所述方法包括:
步骤1)获取种子数据和辐射层级;
步骤2)抽取与种子数据相关的wikidata知识条目;
步骤3)对wikidata知识条目清洗解析,以主-谓-宾三元组的形式存储,并拆分、解析生成知识结构数据,同时根据解析出的关联实体形成辐射实体,生成新的种子数据;若迭代次数未达到辐射层级,进入步骤2),否则,进入步骤4);
步骤4)将知识结构数据进行封装,确定知识模型层级、属性关系和知识实体,将wikidata知识条目对应到知识实体下,形成知识体系;
所述步骤4),具体包括:
从主-谓-宾三元组中获取知识实体的P31字段值和P279字段值,结合本地化数据和wikidata知识库,进行有限次递归查询,形成针对知识实体的类别层级,获得实体类别信息及层级从属信息,确定知识模型层级;其中,P31字段表征该知识实体是某个类的实例,P279字段表征该知识实体所属类是另一个类的子类;
根据确定的知识模型层级,对每个知识模型下所有知识实体从主-谓-宾三元组数据中获取谓语集合,根据解析的结果,将其按属性关系定义到相应知识模型下;
根据获取的辐射层级,将最后一次辐射获得的知识实体转化为该实体指代的名称,从而将知识链接截断形成闭环;
结合知识模型层级、属性关系和知识实体,将主-谓-宾三元组数据对应到相应知识实体下,形成知识体系。
2.根据权利要求1所述的基于wikidata的知识体系自动构建方法,其特征在于,所述步骤2)具体包括:
根据种子数据从本地化数据中采集wikidata知识条目;
对于本地化数据中缺失的信息,采用面向需求的数据查询接口,从wikidata知识库在线采集wikidata知识条目。
3.根据权利要求2所述的基于wikidata的知识体系自动构建方法,其特征在于,所述对wikidata知识条目清洗解析,以主-谓-宾三元组的形式存储,并拆分、解析生成知识结构数据,同时根据解析出的关联实体形成辐射实体,生成新的种子数据;具体包括:
清洗解析wikidata知识条目,以主-谓-宾三元组的形式存储;
拆分wikidata知识条目,主语字段对应知识实体,谓语字段对应为属性关系,宾语字段对应属性值或关联知识实体;
解析出属性和关系,生成知识结构数据;
汇总关联知识实体形成辐射实体,生成新的种子数据。
4.根据权利要求1所述的基于wikidata的知识体系自动构建方法,所述步骤4)还包括:结合体系专家修正信息,对构建的知识体系进行优化。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军军事科学院军事科学信息研究中心,未经中国人民解放军军事科学院军事科学信息研究中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911356255.0/1.html,转载请声明来源钻瓜专利网。