[发明专利]电力标准知识图谱构建方法、装置、计算机设备和介质在审
申请号: | 202011102415.1 | 申请日: | 2020-10-15 |
公开(公告)号: | CN112231418A | 公开(公告)日: | 2021-01-15 |
发明(设计)人: | 陈浩敏;张凡;姚森敬;于力;辛文成;席禹;敖榜;姜臻;张斌;郭志诚;李晋伟;周敬中 | 申请(专利权)人: | 南方电网数字电网研究院有限公司 |
主分类号: | G06F16/28 | 分类号: | G06F16/28;G06F16/36;G06F16/242;G06N3/04;G06N3/08;G06N20/00;G06Q50/06 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 黄恕 |
地址: | 510700 广东省广州市黄*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 电力 标准 知识 图谱 构建 方法 装置 计算机 设备 介质 | ||
1.一种电力标准知识图谱构建方法,所述方法包括:
获取电力标准数据;
对所述电力标准数据进行分析与整理,以自顶向下设计电力标准知识图谱的模式层;
根据所述电力标准知识图谱的模式层,基于规则以及机器学习算法对所述电力标准数据进行知识抽取,得到抽取后的数据;
对抽取后的数据进行实体链接,构建电力标准知识图谱。
2.根据权利要求1所述的方法,其特征在于,所述根据所述电力标准知识图谱的模式层,基于规则以及机器学习算法对所述电力标准数据进行知识抽取,得到抽取后的数据包括:
对所述电力标准数据进行预处理,得到预处理后的数据;
根据所述电力标准知识图谱的模式层,基于规则以及机器学习算法对所述电力标准数据进行实体抽取以及实体关系抽取;
根据实体抽取以及实体关系抽取的结果,得到知识图谱三元组数据;
将所述知识图谱三元组数据与所述电力标准知识图谱的模式层进行匹配,删除所述知识图谱三元组数据中错误的三元组数据、并补齐数据缺失的三元组数据,得到抽取后的数据。
3.根据权利要求2所述的方法,其特征在于,所述根据所述电力标准知识图谱的模式层,基于规则以及机器学习算法对所述电力标准数据进行实体抽取以及实体关系抽取包括:
基于所述电力标准知识图谱的模式层、并采用深度学习模型LSTM-CRF对所述预处理后的数据进行实体抽取,得到实体抽取结果;
基于所述电力标准知识图谱的模式层、并采用序列和树结构的LSTM的关系抽取算法进行关系抽取,得到实体关系抽取结果。
4.根据权利要求2所述的方法,其特征在于,所述对所述电力标准数据进行预处理,得到预处理后的数据包括:
根据所述电力标准知识图谱的模式层对所述电力标准数据依次进行去除脏数据处理,所述脏数据包括冗余数据、重复数据、错误数据以及异常数据的任意一种。
5.根据权利要求1所述的方法,其特征在于,所述对所述电力标准数据进行分析与整理,以自顶向下设计电力标准知识图谱的模式层包括:
对所述电力标准数据进行处理,分析归纳数据模式;
基于预设电力标准经验数据对处理后的数据进行抽象建模,采用自顶向下设计电力标准知识图谱的模式层。
6.根据权利要求1所述的方法,其特征在于,所述对抽取后的数据进行实体链接,构建电力标准知识图谱包括:
对抽取后的数据采用构建名称词典的方式生产候选实体;
采用基于学习排名的算法对所述候选实体进行排序,得到排序结果;
根据所述排序结果进行实体链接,构建电力标准知识图谱。
7.根据权利要求1所述的方法,其特征在于,所述对抽取后的数据进行实体链接,构建电力标准知识图谱之后,还包括:
当接收到搜索请求时,提取所述搜索请求中携带的搜索内容;
对所述搜索内容进行实体提取并识别用户意图数据;
将实体提取结果以及所述用户意图数据转换为SPARQL查询语句;
根据所述SPARQL查询语句,调用SPARQL查询函数从所述电力标准知识图谱查询数据,得到查询结果。
8.一种电力标准知识图谱构建装置,其特征在于,所述装置包括:
标准数据获取模块,用于获取电力标准数据;
模式层设计模块,用于对所述电力标准数据进行分析与整理,以自顶向下设计电力标准知识图谱的模式层;
知识抽取模块,用于根据所述电力标准知识图谱的模式层,基于规则以及机器学习算法对所述电力标准数据进行知识抽取,得到抽取后的数据;
知识图谱构建模块,用于对抽取后的数据进行实体链接,构建电力标准知识图谱。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南方电网数字电网研究院有限公司,未经南方电网数字电网研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011102415.1/1.html,转载请声明来源钻瓜专利网。