[发明专利]一种基于决策树分类的继电保护缺陷文本同义词识别方法在审

专利信息
申请号: 202110418685.1 申请日: 2021-04-19
公开(公告)号: CN113011166A 公开(公告)日: 2021-06-22
发明(设计)人: 薛安成;刘中硕;章家欢;吴超;陈乾;田铭威;欧阳明浩;景子洋;陶畅 申请(专利权)人: 华北电力大学
主分类号: G06F40/247 分类号: G06F40/247;G06F40/30;G06K9/20;G06K9/62
代理公司: 暂无信息 代理人: 暂无信息
地址: 102206*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 决策树 分类 保护 缺陷 文本 同义词 识别 方法
【说明书】:

发明提供了一种基于决策树分类的继电保护缺陷文本同义词识别方法,能够为继电保护缺陷文本分类,缺陷本体、知识图谱等知识模型的构建提供技术支撑。首先,基于潜在语义分析方法实现词语的向量表示;计算词汇间的余弦相似度作为衡量词语语义相似度的指标;构建决策树分类特征集用于同义词识别;利用实际文本数据生成决策树,并调节相关参数使模型的分类效果最优;最后,通过循环迭代的方式生成同义词表并存储。

技术领域

本发明属于电力系统继电保护技术领域,尤其涉及一种基于决策树分类的继电保护缺陷文本同义词识别方法。

背景技术

继电保护在电网运行中起着异常告警、切除故障的作用,对于系统安全稳定运行,提高供电可靠性起着不可替代的作用。由于继电保护在电力系统中的重要地位,因此相关国家标准和企业标准规定了在保护装置投入运行后,须定期对保护装置进行检修,在装置发生故障时,还要进行故障检修。在此运行维护过程中,由运维人员记录了大量的缺陷记录文本,这些文本记录了装置发生缺陷的详细信息,包括缺陷现象、缺陷原因、处理措施、处理结果等,这些信息是在保护装置长期运行维护过程中产生的巨大财富,合理有效地进行分析应用将对后期保护装置研发改进以及运行维护产生重要积极作用。

同时,这些缺陷记录文本数据量巨大,而本身信息密度不高,靠人工来对这些数据做全面的分析几乎不能实现,依靠自然语言处理方法进行文本挖掘是必然趋势。基于此,我们可以充分利用机器学习方法处理速度快、效率高的特点,将其应用到继电保护装置缺陷文本数据挖掘。

同义词识别是所有文本挖掘过程中必不可少的一环,目前已广泛应用于信息检索等各个方面,能提高文献数据库和网络检索的质量与效率。同时,同义词抽取为其它信息的抽取提供了基础性支持,可以对本体、知识库、词典进行正确性检测,并对其进行扩充和完善。因此,识别并构建继电保护缺陷文本同义词表,对缺陷文本数据分析具有重要意义。

发明内容

本发明的目的是提供一种基于决策树分类的继电保护缺陷文本同义词识别方法。该方法根据保护装置缺陷记录自身的文本特点,提出了用于决策树分类的4项特征,并提供了一套完整的继电保护缺陷文本同义词识别流程,为继电保护缺陷文本分类,缺陷本体、知识图谱等知识模型的构建提供技术支撑。

为实现上述目的,本发明采取以下技术方案:

一种基于决策树分类的继电保护缺陷文本同义词识别方法,所述方法包括:

步骤1、基于潜在语义分析方法构建词向量表示矩阵;

步骤2、计算词汇的余弦相似度;

步骤3、构建用于同义词识别的决策树分类特征集;

步骤4、生成同义词识别决策树;

步骤5、由步骤4的分类结果构建同义词表。

所述步骤1中,构建词向量表示矩阵包括构建词-文档矩阵和奇异值分解降维。

所述步骤3中,决策树分类特征集包含:首字相同(FC)、尾字形同(LC)、字符重复比例(RC)和余弦相似度(CS)。

所述步骤4中,决策树参数调节包括数据集不平衡和过拟合两个方面。

由上述本发明提供的技术方案可看出,上述方法给出了一种较为完备的继电保护缺陷文本同义词识别方法,可以为继电保护专业文本分析的工作提供技术支撑,改善人工智能方法在自然语言处理中的表现。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显然,下面描述中的附图仅是本发明的部分实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他附图。

图1为本发明实施例所述的基于决策树分类的继电保护缺陷文本同义词识别方法的流程示意图;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华北电力大学,未经华北电力大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110418685.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top