[发明专利]一种适用于继电保护装置缺陷分析的专业词典构建方法在审
申请号: | 202110418922.4 | 申请日: | 2021-04-19 |
公开(公告)号: | CN113010695A | 公开(公告)日: | 2021-06-22 |
发明(设计)人: | 薛安成;刘中硕;吴超;章家欢;陈乾;田铭威;陶畅;欧阳明浩;景子洋 | 申请(专利权)人: | 华北电力大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/33;G06F16/335;G06F16/35;G06F16/903;G06F40/242;G06F40/247;G06F40/279 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 102206*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 适用于 保护装置 缺陷 分析 专业 词典 构建 方法 | ||
本发明提供一种综合考虑实际运维记录和用于缺陷分析的继电保护装置专业词典构建方法。首先,对缺陷记录进行清洗,删除重复记除、空白记录等无意义记录,之后按照缺陷等级将缺陷文本分为危急、严重、一般三部分,分别进行分词处理。其次,基于正则表达式提取缺陷装置信息、厂站名、输电线路名和人名等。随后,经过基于jieba分词和人工修正的两次分词过程,获得质量更高的专业词典。最后,依靠人工识别并存储的方式实现同义词的合并。上述方法一方面考虑了继电保护装置实际运维中缺陷记录的主要属性,另一方面根据继保专业语料对分词结果中专业词汇进行修正,修正结果提升了机器分词的准确性和专业性,所得分词结果为文本挖掘技术在缺陷分析中的应用提供了基础。
技术领域
本发明涉及继电保护技术领域,尤其涉及一种综合考虑实际运维记录和用于缺陷分析的继电保护装置专业词典构建方法。
背景技术
继电保护系统是电力系统安全、稳定运行的第一道防线,继电保护系统能否正确动作,各类继电保护装置的缺陷管理工作十分关键和重要。继电保护的四项基本要求中快速性、选择性和灵敏性可通过整定计算得以保障,但可靠性与保护装置本身的缺陷情况息息相关,即使动作定值、时间整定和设备配套方案设置合理,装置自身缺陷所引起的二次系统功能缺失会使电网安全稳定运行失去保障,从而导致故障范围扩大、负荷大面积损失、设备损坏、人身伤亡等不利情况。
目前,继电保护行业已经积累了大量的继电保护装置缺陷信息数据。随着缺陷数据量的增长,传统数据分析方法开始向机器学习算法过渡,这为缺陷数据的分析提供了新的思路。值得注意的是,传统数据分析应用均基于现场人员填写好的规范数据开展,忽略了缺陷数据根本上是一种非规范的文本型数据。因此,借助自然语言处理算法的文本挖掘技术值得尝试。但是,文本挖掘技术特殊性在于其对专业领域词典依赖性很高,因此,建立适用于继保装置缺陷分析的专业词典具有较强的实际意义。
发明内容
本发明的目的是提供一种综合考虑实际运维记录和用于缺陷分析的继电保护装置专业词典构建方法。该方法能较好地实现对缺陷文本记录分词并修正从而建立专业词典的目标,为基于文本挖掘技术开展缺陷定级或缺陷信息抽取提供基础。
本发明的目的是通过以下技术方案实现的:
一种适用于继电保护装置缺陷分析的专业词典构建方法,所述方法包括:
步骤1、继电保护缺陷记录文本数据预处理。
步骤2、继电保护缺陷记录停用词表构建。
步骤3、继电保护缺陷记录文本分词。
步骤4、继电保护缺陷记录同义词合并。
所述步骤1中,文本数据预处理包括文本数据清洗,删除重复缺陷记录、空白缺陷记录等无意义数据,按照缺陷等级将缺陷文本分为危急、严重、一般三部分,分别进行分词处理。
所述步骤2中,停用词表构建包括基于正则表达式提取缺陷装置信息、厂站名、输电线路名和人名等。
所述步骤3中,文本数据分词共涉及两次分词,初次粗分词利用jieba分词,然后进行人工修正并对停用词进行补充完善,之后基于该次结果进行二次分词,获得质量更高的专业词典。
所述步骤4中,同义词合并主要基于人工识别并存储。
由上述本发明提供的技术方案可以看出,上述方法一方面考虑了继电保护装置实际运维中缺陷记录的主要属性,另一方面根据继电保护专业语料对分词结果中专业词汇进行修正,修正结果提升了机器分词的准确性和专业性,所得分词结果为文本挖掘技术在缺陷分析中的应用提供了基础。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显然,下面描述中的附图仅是本发明的部分实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他附图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华北电力大学,未经华北电力大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110418922.4/2.html,转载请声明来源钻瓜专利网。