[发明专利]一种基于N-gram模型的工业报警泛滥预测方法有效
申请号: | 201810889499.4 | 申请日: | 2018-08-07 |
公开(公告)号: | CN108922140B | 公开(公告)日: | 2019-08-16 |
发明(设计)人: | 王建东;徐一洲 | 申请(专利权)人: | 山东科技大学 |
主分类号: | G08B29/18 | 分类号: | G08B29/18;G08B31/00;G06F17/18;G06K9/62 |
代理公司: | 北京志霖恒远知识产权代理事务所(普通合伙) 11435 | 代理人: | 朱昀 |
地址: | 266590 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 报警变量 报警 预测 区分度 数据集 信号处理领域 相似性分数 迭代运算 概率模型 时间窗口 数据集中 样本数据 置信区间 贝叶斯 数据段 概率 分段 剔除 统计 | ||
1.一种基于N-gram模型的工业报警泛滥预测方法,其特征在于,包括如下步骤:
(1)获取历史报警泛滥数据集统计其中报警变量计算每个报警变量的区分度Di,对数据集中区分度为0的报警变量进行剔除预处理,形成第一数据集
(2)将第一数据集中的第m个历史报警泛滥序列与正在出现的报警序列逐一进行相似性对比,并将匹配后的序列根据相似性分数从高到低排列,形成第二数据集
(3)设定时间窗口和时间窗口的滑动大小对第二数据集进行分段,并统计每个数据段的数量,求出由第二数据集作为样本时下一个可能出现的报警变量及对应的概率;
(4)通过贝叶斯概率模型求出预测下一个出现的报警的概率和对应的置信区间[Z1,Z2];
(5)对步骤(3)和步骤(4)进行N次迭代运算,取置信区间[Z1,Z2]下限Z1最高的结果对应的数据集中的序列为最佳预测数据集,并将对应的预测结果输出为最终预测结果。
2.根据权利要求1所述的基于N-gram模型的工业报警泛滥预测方法,其特征在于,步骤(1)的具体实现为:
报警变量xi的区分度Di=log{N/|m:xi∈xAF(m)|},其中N代表数据集中包含的历史报警泛滥序列的数目,|m:xi∈xAF(m)|表示数据集中包含该报警元素的历史报警泛滥序列的数目。
3.根据权利要求1所述的基于N-gram模型的工业报警泛滥预测方法,其特征在于,步骤(2)的具体实现过程为:
采用smith-waterman算法计算相似性分数,当正在出现的报警序列xAS与第一数据集中第m个序列进行相似性比对时,构造相似性分数矩阵H(m),初始化第一行和第一列为0,矩阵大小为j×(ml+1),ml为x′AF(m)的长度,
其中1≤i′≤j 1,1≤j′≤ml,Wk′=k′W1是插空长度为k′时的罚
分,W1为单位罚分,是直接匹配xi′和的得分,H(m)i′-k′,j′-Wk′是xi′前插空长度k′的罚分,H(m)i′,j′-l′-Wl′是前插空长度l′的罚分,0表示匹配到xi′和时序列已没有相似性,最终得分矩阵H(m)中最大的元素即为xAS和x′AF(m)的相似性分数;将第一数据集中的报警泛滥序列根据相似性分数从高到低排序,得到第二数据集
4.根据权利要求1所述的基于N-gram模型的工业报警泛滥预测方法,其特征在于,所述步骤(3)中,设定对第二数据集进行分段的时间窗口的长度为n和n-1,时间窗口的滑动大小为1。
5.根据权利要求4所述的基于N-gram模型的工业报警泛滥预测方法,其特征在于,步骤(3)中求由第二数据集作为样本时下一个可能出现的报警变量及对应的概率的具体实现过程为:
以时间窗口n和n-1分别对第二数据集为内的数据进行分段后统计每个数据段的数量,记录进数据集XDS;
预测正在出现的报警序列的下一时刻tj发生的报警时,首先查询XDS中对应的数量以及下一时刻出现的所有报警查询对应的数量,使用最大似然法则近似求出条件概率
设定中使条件概率最大时对应的元素为输出结果记
6.根据权利要求5所述的基于N-gram模型的工业报警泛滥预测方法,其特征在于,n的值为3。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东科技大学,未经山东科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810889499.4/1.html,转载请声明来源钻瓜专利网。