[发明专利]基于频繁项集算法的电力文本知识发现方法及设备在审

专利信息
申请号: 202210542291.1 申请日: 2022-05-17
公开(公告)号: CN114912435A 公开(公告)日: 2022-08-16
发明(设计)人: 梅冰笑;蔺家骏;王渊;李晨;王雅雯;陈珉;张强;马国明;邵先军;杨智;金凌峰 申请(专利权)人: 国网浙江省电力有限公司电力科学研究院;华北电力大学;国网智能电网研究院有限公司
主分类号: G06F40/211 分类号: G06F40/211;G06F40/289;G06N3/04;G06N3/08
代理公司: 浙江翔隆专利事务所(普通合伙) 33206 代理人: 许守金;张建青
地址: 310014 浙江*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 频繁 算法 电力 文本 知识 发现 方法 设备
【权利要求书】:

1.基于频繁项集算法的电力文本知识发现方法,其特征在于,

包括以下步骤:

步骤一,建自然语言处理与信息抽取模型;

所述自然语言处理与信息抽取模型,用于获取电力文本句法结构知识并构建本体字典,对电力文本进行实体识别、分词与词性标注、新词发现以及事件单元抽取处理,形成电力数据文本;

步骤二,对步骤一中的电力数据文本进行识别抽取,形成电力设备故障诊断数据库;

步骤三,构建关联规则挖掘模型;关联规则挖掘模型采用频繁项集算法构建频繁模式树FP-tree,对步骤二中的电力设备故障诊断数据库进行压缩,并保留频繁项集的关联信息;

步骤四,根据步骤三中的关联信息,将电力设备故障诊断数据库中的各数据项按照支持度排序,形成电力数据组;

步骤五,将步骤四中电力数据组中的每个数据项按降序或升序依次插入到频繁模式树FP-tree的节点中,识别出频繁出现的属性值集,同时每个节点处均记录该节点出现的支持度;

步骤六,根据步骤五中的属性值集以及支持度,获取电力文本中故障现象特征与故障发生原因、处置方案之间的关联规则。

2.如权利要求1所述的基于频繁项集算法的电力文本知识发现方法,其特征在于,

所述实体识别包括以下内容:

步骤11,基于深度学习模型,构建神经网络模型并利用神经网络模型将文字符号特征表示为分布式特征信息;

步骤12,利用步骤11中的分布式特征信息,优化网络参数,训练网络模型;

步骤13,利用步骤12中的网络模型对电力文本中的语句实体进行识别。

3.如权利要求2所述的基于频繁项集算法的电力文本知识发现方法,其特征在于,

所述深度学习模型基于双向长短时记忆网络Bi-LSTM以及条件随机场CRF进行构建;

所述双向长短时记忆网络Bi-LSTM包括输入门、遗忘门、输出门,其基于上一时刻的隐藏层信息和本时刻的输入信息计算三个门机制的值,再与上一时刻存储单元中的信息进行整合得到本时刻的单元输出,同时对隐藏层信息和存储单元信息进行更新作为下一时刻双向长短时记忆网络Bi-LSTM的输入;

双向长短时记忆网络Bi-LSTM的计算公式如下:

i=σ(xtUi+st-1Wi)

f=σ(xtUf+st-1Wf)

o=σ(xtUo+st-1Wo)

g=tanh(xtUg+st-1Wg)

ct=ct-1*f+g*i

st=tanh(ct)*o

其中xt表示t时刻网络输入值,st-1表示t-1时刻隐藏层神经元的激活值,C表示记忆单元,U、W分别表示模型参数,σ表示sigmoid激活函数,st表示t时刻LSTM隐藏层的激活值,i、f、o分别表示输入门、遗忘门、输出门。

4.如权利要求3所述的基于频繁项集算法的电力文本知识发现方法,其特征在于,

所述条件随机场CRF基于隐马尔可夫模型和最大熵模型进行构建,其计算公式如下:

其中,x为输入电力文本序列,y为实体标注序列,P(y/x)为给定x条件下输出序列y的条件概率分布,si(yi,x,i)为状态特征函数,tk(yi-1,yi,x,i),Z(x)为规范因子。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网浙江省电力有限公司电力科学研究院;华北电力大学;国网智能电网研究院有限公司,未经国网浙江省电力有限公司电力科学研究院;华北电力大学;国网智能电网研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210542291.1/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top