[发明专利]一种基于属性计算与知识模板的实体优化方法有效
申请号: | 201911277058.X | 申请日: | 2019-12-12 |
公开(公告)号: | CN111159420B | 公开(公告)日: | 2023-04-28 |
发明(设计)人: | 靖稳峰 | 申请(专利权)人: | 西安交通大学;国网浙江省电力有限公司信息通信分公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F40/295 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 高博 |
地址: | 710049 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 属性 计算 知识 模板 实体 优化 方法 | ||
本发明公开了一种基于属性计算与知识模板的实体优化方法,建立包含若干实体以及每个实体属性相关信息的知识库,构建实体及其属性的相关信息形成每个实体的特征向量,实体为若干个;根据特征向量,构建若干个实体之间的关系向量;取其中任意两个实体,分别将其特征向量与实体之间的关系向量进行融合,并根据融合后的结果表示两个实体与关系向量之间的相似度;重复以上步骤至每个实体均与实体之间的关系融合;根据相似度判断两个实体是否为同一实体。本发明能够将粗糙的知识进行凝练,在降低知识库规模的同时,保证了其中知识的质量,为知识库的利用和迭代更新提供了保障。
技术领域
本发明属于信息技术领域,具体涉及一种基于属性计算与知识模板的实体优化方法。
背景技术
随着国家电网公司全业务统一数据中心建设工作的稳步推进,各个单位和部门都在大力开展大数据创新应用,各类研究成果层出不穷,而且取得了一定的成效。在此背景下,积极探索新技术、新方法在业务开展和中心建设过程中的应用,对于提升公司数据管理的质量和水平以及精益化管理和科学决策水平,有着重要的作用。
知识图谱是一种比较通用的语义知识的形式化描述框架,其构成主要包含两部分内容:节点和边。知识图谱中的节点表示客观的实体,而边则表示实体之间的关系。例如,某台变压器可以看成是一个电力设备实体,电力设备有很多,而该变压器实体在客观世界中是独一无二的,对应在知识图谱中,就是一个节点;某条供电线路也可以看做是一个实体,在图谱中也有对应的表示,此外,该供电线路下面可能挂接着不同的变压器,因此,变压器实体和供电线路实体之间就存在着一种关系,用三元组来描述的话,可以表示为:“变压器,属于,线路”。从这个角度来看,知识图谱定义了一种描述实体及其之间关系的模型,可以想见,如果以图的方式对知识图谱进行展现,那么将会形成网状结构。
一个特定领域的知识图谱,往往包含了该领域内公认的知识,这些知识就是通过“实体-关系-实体”或者“实体-属性-属性值”的形式体现的,因此,知识图谱也可以理解为知识库。一个关于电网设备资源的知识图谱,其实就是一个知识库,电力设备的描述性属性和设备实体之间的关系,都体现在知识库中。
知识图谱的建立是一个长期而复杂的过程,初步识别的实体及关系可以作为知识存入知识库中,然而这些知识是粗糙的,往往存在实体冗余、关系错误等问题。如何纠正这些问题,是一项颇具挑战性的工作。
发明内容
本发明所要解决的技术问题在于针对上述现有技术中的不足,提供一种基于属性计算与知识模板的实体优化方法,针对初步建立的电力设备知识图谱中存在的实体冗余、关系错误等问题进行处理,提升知识库的质量。
本发明采用以下技术方案:
一种基于属性计算与知识模板的实体优化方法,包括以下步骤:
S1、建立包含若干实体以及每个实体属性相关信息的知识库,构建实体及其属性的相关信息形成每个实体的特征向量,实体为若干个;
S2、根据特征向量,构建若干个实体之间的关系向量;
S3、取其中任意两个实体,分别将其特征向量与实体之间的关系向量进行融合,并根据融合后的结果表示两个实体与关系向量之间的相似度;
S4、重复步骤S1~S3,至每个实体均与实体之间的关系融合;
S5、根据相似度判断两个实体是否为同一实体。
具体的,步骤S1中,特征向量包括实体的属性名称以及对应属性的具体内容。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学;国网浙江省电力有限公司信息通信分公司,未经西安交通大学;国网浙江省电力有限公司信息通信分公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911277058.X/2.html,转载请声明来源钻瓜专利网。