[发明专利]一种基于词频与逆文档频率的工控系统异常诊断信息识别方法在审
申请号: | 202010733364.6 | 申请日: | 2020-07-27 |
公开(公告)号: | CN111857097A | 公开(公告)日: | 2020-10-30 |
发明(设计)人: | 李少森;梁钰华;孙豪;黄剑湘;杨光;李浩;张启浩;任君;杨铖;丁丙侯 | 申请(专利权)人: | 中国南方电网有限责任公司超高压输电公司昆明局 |
主分类号: | G05B23/02 | 分类号: | G05B23/02;G06F40/289 |
代理公司: | 北京国昊天诚知识产权代理有限公司 11315 | 代理人: | 王华强 |
地址: | 650217 云南省*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 词频 文档 频率 系统 异常 诊断 信息 识别 方法 | ||
1.一种基于词频与逆文档频率的工控系统异常诊断信息识别方法,其特征在于,包括以下步骤:
步骤1:建立诊断命令的响应语料库:向被测系统发送诊断命令N次,将获得的N份回显报文按时间顺序排列,作为诊断命令的响应语料库;
步骤2:再次向被测系统发送诊断命令,获得第N+1份回显报文,将所述第N+1份回显报文添加至步骤1建立的诊断命令响应语料库的最后;
步骤3:对N+1份回显报文进行过滤停用词、分词处理;
步骤4:利用TF-IDF词频与逆文档频率算法,计算N+1份回显报文中每组文本列表中每个词的逆文档频率IDF;
步骤5:设置最低逆文档频率阈值IDFmin,步骤4中计算的每组文本列表的词的逆文档频率IDF若小于等于IDFmin值,则予以删除;
步骤6:将步骤5完成过滤的N+1份回显报文的文本列表向量化:提取出N+1组文本列表内的所有词组,去除重复后获得长度为M的词组表V,其中M等于完成去除重复过滤的词组总数,V代表完成过滤的N+1组文本列表内出现的所有词组,然后将完成过滤的N+1组文本列表按V中词汇的排序对文本列表的词重新排序,然后词组转换为向量,向量大小为该词在该回显报文中出现的次数,并计算出词频值
步骤7:设置词频阈值tfmax,将步骤6计算出来的词频值值与设置的词频阈值tfmax进行比较,若则识别为异常报文,并输出告警信息。
2.根据权利要求1所述的一种基于词频与逆文档频率的工控系统异常诊断信息识别方法,其特征在于,所述步骤1中的诊断命令发送时间间隔为T,T的取值范围根据诊断命令返回结果可能发生变化的时间范围而定,在系统资源不会突变的情况下T的取值范围为1~30天;在网络通道随时可能中断的情况下T的取值范围为1s~24h。
3.根据权利要求1所述的一种基于词频与逆文档频率的工控系统异常诊断信息识别方法,其特征在于,所述步骤3中停用词包括日期和时间。
4.根据权利要求3所述的一种基于词频与逆文档频率的工控系统异常诊断信息识别方法,其特征在于,所述日期格式为yyy-mm-dd,时间格式为hh:mm:ss、h:mm。
5.根据权利要求1所述的一种基于词频与逆文档频率的工控系统异常诊断信息识别方法,其特征在于,所述步骤3中分词处理具体为:以空格作为分隔符,将N+1组命令回显分割成若干词组,组成N+1组一维文本列表。
6.根据权利要求1所述的一种基于词频与逆文档频率的工控系统异常诊断信息识别方法,其特征在于,所述步骤4中IDF的计算公式为:
7.根据权利要求1所述的一种基于词频与逆文档频率的工控系统异常诊断信息识别方法,其特征在于,所述步骤5中IDFmin≥1。
8.根据权利要求1所述的一种基于词频与逆文档频率的工控系统异常诊断信息识别方法,其特征在于,所述步骤6中,词频值的计算方法为:N+1组文本列表内的所有词组,去除重复后获得长度为M的词组表V,其中M等于完成去除重复过滤的词组总数,V代表完成过滤的N+1组文本列表内出现的所有词组,然后将完成过滤的N+1组文本列表按V中词汇的排序对文本列表的词重新排序,然后词组转换为向量,向量大小为该词在其所在回显报文中出现的次数,将获得(N+1)x(M)矩阵A,设aij为矩阵A第i行j列的元素,则对于第N+1组文本列表内每个元素a(N+1)j,其词频定义为:
9.根据权利要求1所述的一种基于词频与逆文档频率的工控系统异常诊断信息识别方法,其特征在于,所述步骤7中的tfmax的取值范围为0.2~0.5。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国南方电网有限责任公司超高压输电公司昆明局,未经中国南方电网有限责任公司超高压输电公司昆明局许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010733364.6/1.html,转载请声明来源钻瓜专利网。