[发明专利]电力操作票文本智能分类方法、装置、设备及介质在审
申请号: | 202110419148.9 | 申请日: | 2021-04-19 |
公开(公告)号: | CN113094494A | 公开(公告)日: | 2021-07-09 |
发明(设计)人: | 董锴;何祥针;孟子杰;吴龙腾;蔡新雷;邱丹骅;王勇超;梁升洪;李嘉铭;崔艳林;黎嘉明;何剑军;赵瑞锋 | 申请(专利权)人: | 广东电网有限责任公司;广东电网有限责任公司电力调度控制中心 |
主分类号: | G06F16/335 | 分类号: | G06F16/335;G06F16/35;G06F40/284;G06N3/04;G06N3/08 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 陈旭红;吕金金 |
地址: | 510000 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 电力 操作 文本 智能 分类 方法 装置 设备 介质 | ||
本发明公开了一种电力操作票文本智能分类方法、装置、设备及介质,该方法包括将第一操作票文本输入至DNN深度神经网络模型进行训练,得到第一操作票文本的深层次语义特征及语义特征向量;计算语义特征向量与训练操作票样本之间的相似度,并根据相似度筛选出与训练操作票样本的匹配度大于预设值的多条操作票文本,作为第二操作票文本;获取第二操作票文本的操作票等级,若操作票等级不一致,利用KNN加权算法计算第二操作票文本中每条文本对总分类操作票文本的影响权重,并根据影响权重与相似度的叠加,得到第二操作票文本的目标操作票等级。本发明不仅提高了文本分类识别的准确率和召回率,同时能够对分类依据进行展示,增强了分类结果的可解释性。
技术领域
本发明涉及人工智能技术领域,具体涉及一种电力操作票文本智能分类方法、装置、设备及介质。
背景技术
目前,针对电力操作票文本的智能分类问题,现有技术先后提出了三种分类模型:第一种,基于One-hot和KNN算法的分类方法,该方法能够实现80%以上的分类准确率;第二种,基于TF-IDF(词频-逆文档频率)词频特征模型的分类方法,该算法模型也同样取得了较好的分类检出率;第三种,基于隐狄利克雷分布的主题向量模型(LDA)构建的停电文本信息的检测模型,该模型也被用于电网事故的舆情监测。
然而,上述几种方法在分类时,均未考虑被检测句子中的词汇顺序以及邻近词汇之间的关联,因此也无法区分句子中每个词汇的重要程度,进而无法获得语句的深层语义信息。鉴于此,现有技术又提出了基于Word2Vec和卷积神经网络(CNN)构建操作票文本的分类模型,并将该模型与上述三类传统文本分类模型进行了详细比较,结果表明该模型在分类效果上具有显著提升。但是,基于CNN网络属于黑箱模型,虽然能直接给出准确度高的分类结果,而如何实现这一结果的中间过程都无法给出解释,因此也不能为现场人员提供分类依据等过程信息,进而使其无法在生产运维中得到实际应用,可学习性及可操作性低。
发明内容
本发明的目的在于提供一种电力操作票文本智能分类方法、装置、设备及介质,以解决现有技术中分类模型无法兼顾分类精度和提供有效分类依据的问题。
为了克服上述现有技术中的缺陷,本发明提供了一种电力操作票文本智能分类方法,包括:
将第一操作票文本输入至DNN深度神经网络模型进行训练,得到所述第一操作票文本的深层次语义特征及语义特征向量;
计算所述语义特征向量与训练操作票样本之间的相似度,并根据所述相似度筛选出与所述训练操作票样本的匹配度大于预设值的多条操作票文本,作为第二操作票文本;
获取所述第二操作票文本的操作票等级,若所述操作票等级不一致,利用KNN加权算法计算所述第二操作票文本中每条文本对总分类操作票文本的影响权重,并根据所述影响权重与所述相似度的叠加,得到所述第二操作票文本的目标操作票等级。
进一步地,所述影响权重与所述相似度叠加时采用的模型为:
式中,i表示词性;j为训练集中按相似度大小排序的操作票文本序列,wj表示第j条文本的权重;k根据测试集遍历寻优的方式获取,即在测试集依次计算当k=1、2、…10时的分类准确率,取分类准确率最高的k值作为在线分类模型的参数;leveli为第k条待分类文本的操作票等级。
进一步地,利用cosin距离的语义相似度算法计算所述语义特征向量与训练操作票样本之间的相似度。
进一步地,在所述将第一操作票文本输入至DNN深度神经网络模型进行训练之前,还包括:
利用Word-Hashing算法对初始操作票文本进行预处理,得到所述第一操作票文本。
进一步地,在所述将第一操作票文本输入至DNN深度神经网络模型进行训练之前,还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东电网有限责任公司;广东电网有限责任公司电力调度控制中心,未经广东电网有限责任公司;广东电网有限责任公司电力调度控制中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110419148.9/2.html,转载请声明来源钻瓜专利网。