[发明专利]基于电力专业词库的企业级知识图谱搜索引擎的实现方法在审

专利信息
申请号: 201711131304.1 申请日: 2017-11-15
公开(公告)号: CN107908738A 公开(公告)日: 2018-04-13
发明(设计)人: 胡勇;陈达;吴延庆 申请(专利权)人: 昆明能讯科技有限责任公司
主分类号: G06F17/30 分类号: G06F17/30;G06F17/27;G06Q50/06
代理公司: 昆明大百科专利事务所53106 代理人: 何健
地址: 650206 云南省昆明市经济技术开发区云*** 国省代码: 云南;53
权利要求书: 查看更多 说明书: 查看更多
摘要: 基于电力专业词库的企业级知识图谱搜索引擎的实现方法,涉及电力系统企业级搜索引擎领域,实现电网全业务域知识的以设备为核心的知识图构建和知识图谱的搜索,通过图谱解决搜索内容的孤立性,实现电网设备的全主题域数据的统一入口搜索;本发明用于实现电网全主题域的知识图谱构建和知识图谱搜索引擎,具有解决目前电网监测信息数据量大、获取有效机制信息效率低下的问题,实现数据资产的扁平化运维,发挥数据资产的价值。
搜索关键词: 基于 电力 专业 词库 企业级 知识 图谱 搜索引擎 实现 方法
【主权项】:
基于电力专业词库的企业级知识图谱搜索引擎的实现方法,其特征在于,具体实现流程如下:1)电网主题域建模,即完成电网设备运行相关的资产域业务数据包括:缺陷、巡视、试验、状态评价、大修技改数据;调度scada数据,计量自动化数据,GIS拓扑数据即电气连接关系数据,气象监测数据,变电包括油色谱、局放、容性的监测数据,人资系统数据包括供电局、部门、班组、人员、财务系统数据建模;将所述数据源根据类型进行数据整合,得到集合S={S1,S2,……,Sn},其中n属于正整数,n为确定的主题域个数,构成知识图谱的内容;Si根据相关主题域的数据,i属于正整数,且i∈[1,n],得到Et1∈Si,Et2∈Si,……Etm∈Si,其中Et为Si主题域的实体E在t时刻产生的数据,m属于正整数,t属于正数,且t>0;2)电网主题域实体识别,对电网设备的关联关系信息梳理,按照不同的主题,分别构建实例集合E={E1,E2,…Ee},其中e属于正整数,且e∈[1,n],比如S4代表人资主题域,E1组织机构实体,E2部门实体,E3班组实体,E4人员实体;3)电网主题域实体属性识别,对实体对象的属性进行整合,构建实体的属性集合P={P1,P2,…Px},其中x属性正整数,且x∈[1,n],比如人员实体时,P={P1(身份证号)、P2(岗位)、P3(邮箱)、P4(电话)、P5(专业技能水平)}等集合信息;4)电网主题域实体关系识别,构建电网主题域的所有实体对象之间的关系集合R={R1,R2,…Ry},其中y属性正整数,且y∈[1,n],比如Si代表电网生产主题域时,R1(设备消缺关系)=(E1(人员),E2(设备实体)),其中R1的关系方向为E1‑>E2,代表业务信息为人员对设备开展消缺操作;5)电网实体关系属性识别,构建实体关系的属性集合Rp={Rp1,Rp2,…Rpz},其中z属性正整数,且z∈[1,n],及针对R1(设备消缺关系)的属性结合Rp={Rp1(缺陷表象),Rp2(缺陷部位),Rp3(缺陷原因),Rp2(缺陷处理措施),Rpz},代表该关系对应的属性信息;6)电网全业务域知识图谱化;基于上述1、2、3、4、5步骤的梳理,通过图数据库,实现实例、关系、属性的固化存储,构架电网域的网络知识图谱,实现电网全业务域知识的图谱化管理;7)采用IK分词器构建搜索引擎的中文分词器,IK分词器,分为ik_max_word、ik_smart分词器ik_max_word:会将文本做最细粒度的拆分Eq:“XX,供电局,供电,局”ik_smart:会做最粗粒度的拆分Eq:“XX,供电局”;8)构建电力专业词库,梳理和固化电力行业的专业词库,辅助搜索引擎的分析和NLP自然语言处理;9)实现基于电力专业词库,集合IK分词器的决策树随机森林算法,实现知识图谱数据的搜索匹配,主要包含NLP自然语言处理,实例的识别、关系关键之识别,属性识别,最终返回相关对象的知识图谱;比如XX供电局管辖的XX变电站所属的XX变压器的消缺信息==》XX供电局(实体)管辖(关系)的XX变电站(实体)所属(关系)的XX变压器(实体)的消缺信息(关系)。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明能讯科技有限责任公司,未经昆明能讯科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201711131304.1/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top