[发明专利]基于频繁项集算法的电力文本知识发现方法及设备在审
申请号: | 202210542291.1 | 申请日: | 2022-05-17 |
公开(公告)号: | CN114912435A | 公开(公告)日: | 2022-08-16 |
发明(设计)人: | 梅冰笑;蔺家骏;王渊;李晨;王雅雯;陈珉;张强;马国明;邵先军;杨智;金凌峰 | 申请(专利权)人: | 国网浙江省电力有限公司电力科学研究院;华北电力大学;国网智能电网研究院有限公司 |
主分类号: | G06F40/211 | 分类号: | G06F40/211;G06F40/289;G06N3/04;G06N3/08 |
代理公司: | 浙江翔隆专利事务所(普通合伙) 33206 | 代理人: | 许守金;张建青 |
地址: | 310014 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 频繁 算法 电力 文本 知识 发现 方法 设备 | ||
本发明公开了基于频繁项集算法的电力文本知识发现方法及设备,属于电力设备运维技术领域。本发明的基于频繁项集算法的电力文本知识发现方法,构建自然语言处理与信息抽取模型,获取电力文本句法结构知识并构建本体字典,对电力文本进行实体识别、分词与词性标注、新词发现以及事件单元抽取处理,使得电力文本分布规律、形式统一,形成电力数据文本。同时,本发明构建关联规则挖掘模型,利用频繁项集算法构建频繁模式树FP‑tree,识别出频繁出现的属性值集以及每个节点处的支持度;从而获取电力文本中故障现象特征与故障发生原因、处置方案之间的关联规则,发现电力文本中蕴含的知识,为电力设备故障诊断提供更精准的辅助决策。
技术领域
本发明涉及基于频繁项集算法的电力文本知识发现方法及设备,属于电力设备运维技术领域。
背景技术
由于核心电力设备和输电重要线路,其安全运行对整个电力系统的安全至关重要,尤其是运维管理要求高、安全运维责任重大,检修作业的专业化程度高,数据采集工作量也很大。目前针对输变电设备和线路运行数据的采集分析应用还处于初级阶段,前期梳理的设备故障知识库主要以非结构化的形式管理存储,应用较为困难,且尚未结合设备线路的相关规程和案例处置信息,无法实现智能信息检索和推荐,难以有效帮助设备和线路异常监测,以及故障诊断。
发明内容
针对现有技术的缺陷,本发明的目的一在于提供一种构建自然语言处理与信息抽取模型,获取电力文本句法结构知识并构建本体字典,对电力文本进行实体识别、分词与词性标注、新词发现以及事件单元抽取处理,使得电力文本分布规律、形式统一,形成电力数据文本,进而能够整合提取出电力设备故障/缺陷文本中的有效数据,形成了电力设备故障诊断数据库;同时,构建关联规则挖掘模型,利用频繁项集算法构建频繁模式树FP-tree,对电力设备故障诊断数据库进行压缩,并保留频繁项集的关联信息,进而识别出频繁出现的属性值集以及每个节点处的支持度;从而获取电力文本中故障现象特征与故障发生原因、处置方案之间的关联规则,发现电力文本中蕴含的知识,为电力设备故障诊断提供更精准的辅助决策的电力文本知识发现方法。
本发明的目的二在于提供一种通过自然语言处理与信息抽取模块进行文本数据进行归集整合,从而提取出电力设备故障/缺陷文本中的有效数据,形成了电力设备故障诊断数据库;同时利用关联规则挖掘模块利用关联规则挖掘知识发现技术实现对电力文本数据中文本信息进行有效归类,建立映射关系;进而利用FP-growth频繁项集挖掘的技术,解决了传统关联规则挖掘过程中连接较多、占用空间大、运算量大等问题的电力文本知识发现设备。
为实现上述目的之一,本发明的第一种技术方案为:
基于频繁项集算法的电力文本知识发现方法,
包括以下步骤:
步骤一,构建自然语言处理与信息抽取模型;
所述自然语言处理与信息抽取模型,用于获取电力文本句法结构知识并构建本体字典,对电力文本进行实体识别、分词与词性标注、新词发现以及事件单元抽取处理;
步骤二,对步骤一中的电力数据文本进行识别抽取,形成电力设备故障诊断数据库;
步骤三,构建关联规则挖掘模型;关联规则挖掘模型采用频繁项集算法构建频繁模式树FP-tree,对步骤二中的电力设备故障诊断数据库进行压缩,并保留频繁项集的关联信息;
步骤四,根据步骤三中的关联信息,将电力设备故障诊断数据库中的各数据项按照支持度排序,形成电力数据组;
步骤五,将步骤四中电力数据组中的每个数据项按降序或升序依次插入到频繁模式树FP-tree的节点中,识别出频繁出现的属性值集,同时每个节点处均记录该节点出现的支持度;
步骤六,根据步骤五中的属性值集以及支持度,获取电力文本中故障现象特征与故障发生原因、处置方案之间的关联规则。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网浙江省电力有限公司电力科学研究院;华北电力大学;国网智能电网研究院有限公司,未经国网浙江省电力有限公司电力科学研究院;华北电力大学;国网智能电网研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210542291.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种清洁底座及清洁系统
- 下一篇:一种人工合成的噬菌肽SEYT1及其应用