[发明专利]基于孤立森林算法的铝型材挤压过程流数据异常检测方法、设备及存储介质有效
申请号: | 202010755731.2 | 申请日: | 2020-07-31 |
公开(公告)号: | CN111931834B | 公开(公告)日: | 2023-05-02 |
发明(设计)人: | 杨海东;印四华;徐康康;朱成就;许志城;胡罗克 | 申请(专利权)人: | 广东工业大学 |
主分类号: | G06F18/2431 | 分类号: | G06F18/2431;G06F18/2433 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 林丽明 |
地址: | 510062 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 孤立 森林 算法 铝型材 挤压 过程 数据 异常 检测 方法 设备 存储 介质 | ||
1.基于孤立森林算法的铝型材挤压过程流数据异常检测方法,其特征在于,包括以下步骤:
S10:读取挤压机挤压过程原始流数据,并通过原始流数据对多特征半空间孤立森林模型进行初始化;
S20:进入检测周期,使用多特征半空间孤立森林模型对当前周期流数据进行异常检测;
S30:判断检测周期是否结束,若未结束,则返回步骤S20,更新检测周期,若结束,则进入下一步;
S40:判断当前周期异常率是否大于阈值,若是则表示存在概念漂移,使用当前周期数据对模型进行更新,若否则返回步骤S20,进入下一周期检测直至全部周期检测完毕为止;
其中,所述的流数据为随时间变化不断增长的数据,所述的流数据包括:
多维流数据:记一组n维时间序列流数据X=X1,X2,…,Xn,则任一维度Xi=Xi1,…,Xij,…;其中,Xij表示第i维数据在j时刻的值,任意一对数(Xij,Xi(j+1))所在两个时刻之间严格递增,且Xi的长度随着新数据的流入不断增长;
多维流数据子序列:在一组n维时间序列流数据X=X1,X2,…,Xn中,记长度为m的n维流数据子序列X’=X1’,X2’,…,Xn’;其中,对于任一维度Xi’=Xi1,…,Xim,|Xi’|=m;
统计特征值:对于任一长度为m的子序列Xi’=Xi1,…,Xim,利用不同的描述统计量公式对子序列进行计算得到的值,称为统计特征值;其中,所述的描述统计量包括均值、方差、峰度以及偏度;对于一个长度为m的子序列Xi’,其统计特征值计算公式如式(1)~式(4)所示;
均值是数据中心位置的一种度量,反映总体数据的一般水平,其计算式为:
方差反映了数据的变异程度,可以衡量一组数据离散程度,其计算式为:
偏度是统计数据分布偏斜方向和程度的度量;偏度小于0,表示当前数据分布为左偏态;反之,表示当前数据分布为右偏态;偏度的绝对值越高,表示数据分布的偏离程度越高,其计算式为
峰度是描述总体序列中数据分布形态陡缓程度的统计量;峰度越大表示序列分布越陡峭,峰度越小表示序列数据分布越平坦,其计算式为
设备状态向量:设任一统计特征值的计算函数为f(X),其中X为序列数据;对于一组多维流数据子序列X’=X1’,X2’,…,Xn’,称多维流数据子序列的统计向量stat(X’)=f(X1’),f(X2’),…,f(Xn’)为设备在子序列所属时间段的设备状态向量。
2.根据权利要求1所述的基于孤立森林算法的铝型材挤压过程流数据异常检测方法,其特征在于,在步骤S20中,异常检测过程包括以下步骤:
S201:切割多维流数据子序列;
S202:对切割后的子序列数据进行统计特征值的提取;
S203:构建MHSIF异常检测模型;
S204:采用MHSIF异常检测模型对步骤S202中提取后数据进行异常检测;
S205:合并检测结果并记录周期异常数;
S206:输出检测结果。
3.根据权利要求2所述的基于孤立森林算法的铝型材挤压过程流数据异常检测方法,其特征在于,步骤S201的具体过程为:在子树的构造阶段,得到数据各维度的取值边界,随机选择某一维度,以该维度的中点作为划分点切割子空间。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010755731.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种可视化树木修剪控制装置
- 下一篇:一种化工原料桶运输装置