[发明专利]一种智能IETM故障维修记录文本的知识挖掘方法有效
申请号: | 201911034442.7 | 申请日: | 2019-10-29 |
公开(公告)号: | CN110781671B | 公开(公告)日: | 2023-02-14 |
发明(设计)人: | 李爱国;张晓云 | 申请(专利权)人: | 西安科技大学 |
主分类号: | G06F40/279 | 分类号: | G06F40/279;G06F40/242;G06F16/35;G06F16/33;G06N3/0464;G06N3/08 |
代理公司: | 西安创知专利事务所 61213 | 代理人: | 谭文琰 |
地址: | 710054 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 智能 ietm 故障 维修 记录 文本 知识 挖掘 方法 | ||
本发明公开了一种智能IETM故障维修记录文本的知识挖掘方法,包括步骤:一、收集设备故障维修记录文本数据;二、建立设备故障词库;三、获取词项文档矩阵;四、生成主题文档矩阵;五、训练标签特征矩阵;六、构建神经网络;七、设备故障维修记录文本的分类。本发明利用LDA主题模型对词项文档矩阵特征提取,得到标签特征矩阵,提供故障维修记录文本的分类标签,快速对设备故障维修记录文本分类,并且分类结果准确,另外将卷积神经网络中的池化层替换成循环层,卷积神经网络中卷积层具有共享权值的优点、循环层具有解决文本长期依赖关系的问题的优点,为智能IETM平台中故障维修辅助系统提供了充足的知识数据。
技术领域
本发明属于知识挖掘技术领域,具体涉及一种智能IETM故障维修记录文本的知识挖掘方法。
背景技术
在人机交互技术、大数据技术、虚拟现实技术等技术的不断推动下,传统的IETM(Interaction Electronic Technical Manuel)已经不能满足装备的故障维修和保障工作的需求。智能IETM应具有自动学习的思维逻辑,正确的分析和判断能力,其中知识是不可缺少的组成元素。文本知识挖掘是从包含大量噪声的设备运行状况信息数据中提取有效的知识数据,完成故障诊断知识的获取。知识获取是整个智能IETM故障维修辅助系统的核心,同时也是重点和难点。解决知识获取困难问题,便于完成智能IETM故障维修辅助知识库的建立。
目前,故障维修记录文本信息主要采用自然语言处理技术,针对故障维修记录文本数据本身的特点,将一些通用的文本处理算法应用到设备故障维修记录文本知识挖掘处理领域,主要是对文本预处理和特征提取等一些操作。目前在智能IETM故障维修领域中仍存在对文本处理不足的问题:第一,在设备故障维修文本特征提取过程中,设备故障维修记录是由不同的维护人员记录,会出现文本长短不一致问题,最短文本有可能几个字,最长文本达到几十个字,有相当一部分文本记录数据中存在量词、数字等停用词;第二,在设备故障维修记录文本分类中,存在对文本词汇的词义和语义的关系处理,以及文本上下之间的依赖关系问题的处理不足;经典的文本分类算法无法满足上述问题,因此出现准确率低和故障诊断误差的问题。
发明内容
本发明所要解决的技术问题在于针对上述现有技术中的不足,提供一种智能IETM故障维修记录文本的知识挖掘方法,利用LDA主题模型对词项文档矩阵特征提取,得到标签特征矩阵,提供故障维修记录文本的分类标签,快速对设备故障维修记录文本分类,并且分类结果准确,另外将卷积神经网络模型中的池化层替换成循环层,卷积神经网络模型中卷积层具有共享权值的优点、循环层具有解决文本长期依赖关系的问题的优点,为智能IETM平台中故障维修辅助系统提供了充足的知识数据,便于推广使用。
为解决上述技术问题,本发明采用的技术方案是:一种智能IETM故障维修记录文本的知识挖掘方法,其特征在于,该方法包括以下步骤:
步骤一、收集设备故障维修记录文本数据:设备数据收集人员通过智能IETM平台对设备故障维修记录文本数据进行采集和记录,故障维修记录文本数据以自然语言的形式记录在设备故障维修记录表中,所述设备故障维修记录表包括故障原因编码、故障原因描述、维修措施和反映问题描述,其中,故障原因编码表示故障原因的唯一标识符号;故障现象描述表示设备运行过程中出现故障时发生的现象描述;故障原因描述表示从故障原因描述中,由本领域专业人员确定故障出现的原因情况;维修措施表示针对当前出现的故障而采取对应维修措施的方案;
步骤二、建立设备故障词库:利用结巴分词工具和哈工大停用词表对收集的设备故障维修记录文本数据进行分词并去噪,在利用人工筛选的方式建立设备故障词库;
步骤三、获取词项文档矩阵:利用词袋假设对设备故障词库中的词项进行分析,并建立设备故障词库中词项的词项文档矩阵;
步骤四、生成主题文档矩阵,过程如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安科技大学,未经西安科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911034442.7/2.html,转载请声明来源钻瓜专利网。