[发明专利]基于NLP-CNN的燃气轮机控制系统故障诊断分类方法在审
申请号: | 202210489921.3 | 申请日: | 2022-05-06 |
公开(公告)号: | CN114818951A | 公开(公告)日: | 2022-07-29 |
发明(设计)人: | 尹德斌;彭道刚;裴浩然;张腾;戚尔江;王丹豪 | 申请(专利权)人: | 上海工业自动化仪表研究院有限公司;上海电力大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F40/242;G06F40/289;G06N3/04;G06N3/08 |
代理公司: | 苏州所术专利商标代理事务所(普通合伙) 32473 | 代理人: | 孙兵 |
地址: | 200233 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 nlp cnn 燃气轮机 控制系统 故障诊断 分类 方法 | ||
1.一种基于NLP-CNN的燃气轮机控制系统故障诊断分类方法,其特征在于,所述方法包括:
获取用于自然语言学习的资料库,并且收集与燃气轮机控制系统有关的文本信息,以用于构建所述燃气轮机控制系统的专用及停用词典,所述文本信息包括所述燃气轮机控制系统的报警历史日志、控制说明以及设备及专用名称;
对收集到的文本信息进行预处理操作,以形成经处理的短文本,并且对所述短文本进行向量化处理,从而形成短文本向量,所述预处理操作包括翻译、分词以及去停用词;
以预设关键词为标志,从所述报警历史日志中提取与所述预设关键词相关联的第一预设时间段内的日志集合,对所述日志集合的故障原因进行核准,以形成用于文本模型学习的样本库,所述预设关键词为用于表示所述燃气轮机控制系统的故障类型的关键词;
采用CNN模型进行词向量训练模型的搭建,并调整优化模型中的参数;
将所述样本库中的日志集合进行分词,调取各分词的特征向量,并且求取短文本的句向量,并划分训练集及测试集,进行模型训练和测试,从而得到燃气轮机控制系统故障诊断的诊断结果。
2.根据权利要求1所述的基于NLP-CNN的燃气轮机控制系统故障诊断分类方法,其特征在于,所述资料库包括中文维基百科资料库。
3.根据权利要求1所述的基于NLP-CNN的燃气轮机控制系统故障诊断分类方法,其特征在于,所述对所述短文本进行向量化处理,包括:利用Word2vec模型对经预处理操作形成的报警日志短文本进行向量化处理。
4.根据权利要求3所述的基于NLP-CNN的燃气轮机控制系统故障诊断分类方法,其特征在于,所述对收集到的文本信息进行预处理操作,以形成经处理的短文本,并且对所述短文本进行向量化处理,从而形成短文本向量,包括:
对收集到的文本信息进行中英文替换,替换掉文本信息中的英文词,以形成中文格式的文本信息;
构件语料库,所述语料库包括来自中文维基百科的语料、电厂专用语料以及将报警日志翻译为中文日志形成的语料;
对所述中文格式的文本信息进行分词及去停用词处理,以形成短文本;
使用gensim的word2vec模型进行训练,并生成所述短文本中的每个词的向量化模型;
将所述短文本向量化,经向量化的短文本为后续的训练及测试提供输入。
5.根据权利要求4所述的基于NLP-CNN的燃气轮机控制系统故障诊断分类方法,其特征在于,所述对收集到的文本信息进行中英文替换,替换掉文本信息中的英文词,以形成中文格式的文本信息,包括:获取燃气轮机控制系统的报警速查手册,根据所获取的报警速查手册,制作成中英文对照表,采用所述中英文对照表,对收集到的文本信息进行中英文替换,替换掉文本信息中的英文词,以形成中文格式的文本信息。
6.根据权利要求4所述的基于NLP-CNN的燃气轮机控制系统故障诊断分类方法,其特征在于,所述对所述中文格式的文本信息进行分词及去停用词处理,包括:使用jieba工具的精进模式对所述中文格式的文本信息进行分词处理,并且建立停用词表,并比对所述中文格式的文本信息中的每一个词条,以去除停用词。
7.根据权利要求4所述的基于NLP-CNN的燃气轮机控制系统故障诊断分类方法,其特征在于,所述将所述短文本向量化,包括:将每个单条报警日志中的所有分词进行求和,并取平均,以得到本条短文本的句向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海工业自动化仪表研究院有限公司;上海电力大学,未经上海工业自动化仪表研究院有限公司;上海电力大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210489921.3/1.html,转载请声明来源钻瓜专利网。