[发明专利]基于知识图谱的电力信息运维系统数据库构建方法在审

专利信息
申请号: 201810762686.6 申请日: 2018-07-12
公开(公告)号: CN109033284A 公开(公告)日: 2018-12-18
发明(设计)人: 陈倩;吴飞;罗富财;李霆;杨启航;林伟;刘心;魏煜;温丽清 申请(专利权)人: 国网福建省电力有限公司;福建亿榕信息技术有限公司
主分类号: G06F17/30 分类号: G06F17/30;G06F17/27;G06Q10/00;G06Q50/06
代理公司: 福州元创专利商标代理有限公司 35100 代理人: 蔡学俊;丘鸿超
地址: 350003 福*** 国省代码: 福建;35
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 电力信息 运维 运维系统 数据库构建 图谱 知识库 电力信息数据 智能化应用 存储技术 电力数据 电力系统 领域知识 模型优化 数据隐藏 数据转化 信息展现 用户在线 电网 单数据 关联性 模型化 文本化 相似度 低维 分词 构建 数据库 存储 直观 孤立 智能 分类 咨询
【权利要求书】:

1.一种基于知识图谱的电力信息运维系统数据库构建方法,其特征在于,包括以下步骤:

步骤1:对电力系统工单数据进行工单采集,并转换为文本格式,采用七步法进行本体构建,根据文本含义属性划分为多个文本域;

步骤2:以工单为单位,对工单文本数据进行分词处理;

步骤3:对文本域进行分组;

步骤4:对各文本域分别进行域分词处理,采用基于字符串匹配的分词方法分别对各分组的内容进行词汇切分;

步骤5:根据无效词汇表进行无效词汇过滤,过滤掉无效词汇和敏感词汇;

步骤6:将有效词汇与知识库中词汇表进行比对,将新词汇加入到知识库的词汇列表,对己有词汇进行累加其出现的频次;

步骤7:抽取加入词汇的实体关系:通过预先定义实体关系类型及基于实体的特征,抽取实体关系,采用word2vec对词特征向量进行处理,计算词向量之间的相似度,并根据相似度进行实体关系的分类;

步骤8:将实体与实体关系的分类导入Neo4j图数据库。

2.根据权利要求1所述的基于知识图谱的电力信息运维系统数据库构建方法,其特征在于:步骤2和步骤4中,分词采用中科院的ICTCLAS系统;

将分词后的所有词组成字符表D,D={d1,d2,...,dn},其中di表示一个词,i∈[1,n];将每个词E的词特征向量表示为V={v1,v2,...,vn},其中vi代表该词是否对应字符表D中的di,vi的计算方式如下:

3.根据权利要求2所述的基于知识图谱的电力信息运维系统数据库构建方法,其特征在于:步骤2和步骤4中,分词还包括词性特征的构建:词性特征的构建与词特征的构建方式一致。

4.根据权利要求1所述的基于知识图谱的电力信息运维系统数据库构建方法,其特征在于:对电力系统工单数据采用Python的urllib2包对非结构化文本数据的内容进行采集;采用BeautifulSoup包对采集的内容进行解析;采用R环境下的Rwordseg包进行分词。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网福建省电力有限公司;福建亿榕信息技术有限公司,未经国网福建省电力有限公司;福建亿榕信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810762686.6/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top