[发明专利]一种基于词频与逆文档频率的工控系统异常诊断信息识别方法在审
申请号: | 202010733364.6 | 申请日: | 2020-07-27 |
公开(公告)号: | CN111857097A | 公开(公告)日: | 2020-10-30 |
发明(设计)人: | 李少森;梁钰华;孙豪;黄剑湘;杨光;李浩;张启浩;任君;杨铖;丁丙侯 | 申请(专利权)人: | 中国南方电网有限责任公司超高压输电公司昆明局 |
主分类号: | G05B23/02 | 分类号: | G05B23/02;G06F40/289 |
代理公司: | 北京国昊天诚知识产权代理有限公司 11315 | 代理人: | 王华强 |
地址: | 650217 云南省*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 词频 文档 频率 系统 异常 诊断 信息 识别 方法 | ||
本发明揭示一种基于词频与逆文档频率的工控系统异常诊断信息识别方法,包括:建立诊断命令的响应语料库;再次向被测系统发送诊断命令,获得第N+1份回显报文;对所有回显报文进行过滤停用词、分词处理;利用TF‑IDF词频与逆文档频率算法,计算所有回显报文的每组文本列表中每个词的逆文档频率IDF;设置最低逆文档频率阈值IDFmin,删除不大于IDFmin的词;将过滤的N+1份回显报文的文本列表建立词组列表V,并计算出词频值;设置词频阈值,将计算出的词频值与设置的词频阈值进行比较,来判断异常。本发明的算法可通过自学习方式定义每条诊断命令回显信息的健康度,可大幅度降低工控监测系统的人工开发成本,提高事件判断及时性。
技术领域
本发明涉及工控系统异常诊断技术领域,具体地,涉及一种基于词频与逆文档频率的工控系统异常诊断信息识别方法。
背景技术
目前,部分工控系统基于远程管理实现运维,不提供屏幕、按键等本地操作界面供现场运维人员交互,必须使用调试电脑接入,以调试软件/浏览器等方式与装置互动,以查看、分析系统问题。一旦出现通道或装置异常事件,现场运维人员只能根据其他业务系统的通道中断告警、远程监控中心(如各级调度主站等)的运维人员反馈获悉,然后使用调试电脑接入工控系统检查、分析异常原因并处理。如果远程监控未注意到异常,则只能等现场运维人员定期运维、配置备份时才能发现,故障处理普遍滞后不及时。由于工控系统的异常存在随机性,人工定期查看分析难以抓住异常瞬间的详细信息,因此随着时间推移,其异常分析的质量越低。
发明内容
针对现有技术的不足,本发明提供一种基于词频与逆文档频率的工控系统异常诊断信息识别方法,解决现有技术中工控系统异常分析质量低下的问题。
本发明公开的一种基于词频与逆文档频率的工控系统异常诊断信息识别方法,包括以下步骤:
步骤1:建立诊断命令的响应语料库:向被测系统发送诊断命令N次,将获得的N份回显报文按时间顺序排列,作为诊断命令的响应语料库;
步骤2:再次向被测系统发送诊断命令,获得第N+1份回显报文,将所述第N+1份回显报文添加至步骤1建立的诊断命令语料库的最后;
步骤3:对N+1份回显报文进行过滤停用词、分词处理;
步骤4:利用利用TF-IDF词频与逆文档频率算法,计算N+1份回显报文中每组文本列表中每个词的逆文档频率IDF;
步骤5:设置最低逆文档频率阈值IDFmin,步骤4中计算的每组文本列表的词的逆文档频率IDF若小于等于IDFmin值,则予以删除;
步骤6:将步骤5完成过滤的N+1份回显报文的文本列表向量化:提取出N+1组文本列表内的所有词组,去除重复后获得长度为M的词组表V,其中M等于完成去除重复过滤的词组总数,V代表完成过滤的N+1组文本列表内出现的所有词组,然后将完成过滤的N+1组文本列表按V中词汇的排序对文本列表的词重新排序,然后词组转换为向量,向量大小为该词在其所在回显报文中出现的次数,并计算出词频值
步骤7:设置词频阈值tfmax,将步骤6计算出来的词频值值与设置的词频阈值tfmax进行比较,若则识别为异常报文,并输出告警信息。
根据本发明的一实施方式,步骤1中的诊断命令发送时间间隔为T,T的取值范围根据诊断命令返回结果可能发生变化的时间范围而定,在系统资源不会突变的情况下T的取值范围为1~30天;在网络通道随时可能中断的情况下T的取值范围为1s~24h。
根据本发明的一实施方式,步骤3中停用词包括日期和时间。
根据本发明的一实施方式,日期格式为yyy-mm-dd,时间格式为hh:mm:ss、h:mm。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国南方电网有限责任公司超高压输电公司昆明局,未经中国南方电网有限责任公司超高压输电公司昆明局许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010733364.6/2.html,转载请声明来源钻瓜专利网。