[发明专利]基于双向门控循环单元的电力预案知识图谱构建方法及系统在审
申请号: | 202010928917.3 | 申请日: | 2020-09-07 |
公开(公告)号: | CN112100397A | 公开(公告)日: | 2020-12-18 |
发明(设计)人: | 杨群;郭榕;刘绍翰;王波;闪鑫;陆廷骧;李雷 | 申请(专利权)人: | 南京航空航天大学;国电南瑞科技股份有限公司;国电南瑞南京控制系统有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/35;G06F40/279;G06F40/284;G06N3/08 |
代理公司: | 南京纵横知识产权代理有限公司 32224 | 代理人: | 张欢欢 |
地址: | 211106 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 双向 门控 循环 单元 电力 预案 知识 图谱 构建 方法 系统 | ||
1.一种基于双向门控循环单元的电力预案知识图谱构建方法,其特征是,包括:
获取电力预案文本数据;
对电力预案文本进行实体和实体间关系抽取;其中实体间关系抽取是基于预先训练的引入注意力机制的双向门控循环结构网络,抽取得到实体间关系结果;
基于抽取得到的实体和实体间关系,构建电力预案知识图谱并进行可视化展示。
2.根据权利要求1所述的一种基于双向门控循环单元的电力预案知识图谱构建方法,其特征是,所述获取电力预案文本数据后,还包括对获得的文本数据进行预处理,所述预处理包括:去除停用词和长句切分。
3.根据权利要求1所述的一种基于双向门控循环单元的电力预案知识图谱构建方法,其特征是,所述对电力预案文本进行实体抽取,包括:
对电力预案文本进行分词处理;
对电力预案文本中的每个词进行词性标注;
从词性标注结果中抽取实体。
4.根据权利要求3所述的一种基于双向门控循环单元的电力预案知识图谱构建方法,其特征是,所述词性包括五类,分别为:
描述电力系统中厂站设备的名词,词性为实体En;
描述预案处置动作的动词,词性为动词Pv;
电力预案文本中表示指标的词,词性为指标Pn;
描述指标数量的量词,词性为量词Pq;
除以上四类之外的其他词。
5.根据权利要求1所述的一种基于双向门控循环单元的电力预案知识图谱构建方法,其特征是,所述基于引入注意力机制的双向门控循环结构网络,抽取得到实体间关系结果,包括:
所述引入注意力机制的双向门控循环结构网络,包括:
输入层、嵌入层、双向门控循环结构网络、字符级注意力层、句子级注意力层、关系分类层和输出层;其中:
输入层:对电力预案文本进行分词处理,将得到的词序列结果送入嵌入层;
嵌入层:将词序列转换成对应的词向量;
双向门控循环结构网络:从输入的词向量中提取词特征;
字符级注意力层:提取对于分类起到关键作用的词特征,使词汇级的特征合并为句子级的特征;
句子级注意力层:提取对于分类起到关键作用的句子级特征,得到句子特征向量;
关系分类层:将句子特征向量送入分类器,得到各类关系的可能概率;
输出层:将可能概率最大的关系类别做为句中实体间关系的类别输出。
6.根据权利要求5所述的一种基于双向门控循环单元的电力预案知识图谱构建方法,其特征是,所述双向门控循环结构网络中从输入的词向量中提取词特征,包括:
在双向GRU网络中,嵌入层输出的文本词序列向量,分别被输入到两个GRU中,i时刻前向隐藏状态输出和反向隐藏状态输出的组合就是网络的输出hi,即
GRU网络的公式定义如下:
更新门(zt):zt=σ(Wzxt+Uzht-1+bz);
重置门(rt):rt=σ(Wrxt+Urht-1+br);
当前时刻t对应的状态(ht):
候选状态
其中,σ表示sigmoid激活函数,通过激活函数的转换,使zt和rt的数值范围转换为[0,1];tanh表示双曲正切激活函数;符号表示元素对应相乘;xt则表示该神经网络在t时刻的输入,同时Wz、Wr、Wh和Uz、Ur、Uh分别为该模型的参数矩阵和循环权重,bZ、br和bh为偏置向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京航空航天大学;国电南瑞科技股份有限公司;国电南瑞南京控制系统有限公司,未经南京航空航天大学;国电南瑞科技股份有限公司;国电南瑞南京控制系统有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010928917.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种电子换挡手柄安装结构及装配方法
- 下一篇:一种双工位式的透明膜三维裹包机