[发明专利]一种基于小样本学习的冲击地压时序预测模型构建方法在审
申请号: | 202211708756.2 | 申请日: | 2022-12-29 |
公开(公告)号: | CN115983465A | 公开(公告)日: | 2023-04-18 |
发明(设计)人: | 曹安业;杨旭;刘亚鹏;刘耀琪;王常彬;牛强 | 申请(专利权)人: | 中国矿业大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q50/02;G06F18/2135;G06F17/18;G06F18/2321;G06F18/2415;G06N3/047;G06N3/08;G06N3/0442;G06N3/0464;E21F17/18;G01V1/28 |
代理公司: | 徐州苏越知识产权代理事务所(普通合伙) 32543 | 代理人: | 张旭 |
地址: | 221116*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 样本 学习 冲击 地压 时序 预测 模型 构建 方法 | ||
1.一种基于小样本学习的冲击地压时序预测模型构建方法,其特征在于,包括以下步骤:
步骤1、矿震数据处理:在采煤工作面四周安装微震传感器,微震传感器将采集到的原始微震数据传至地面控制室的上位机,原始微震数据包括微震数据发生时间、能量大小、震源坐标,由上位机对原始微震数据进行微震数据处理,首先将原始微震数据按照时间段处理,得到每个时间段中的微震数据,然后将微震数据进行标准化处理后得到每个时间段的时间序列数据;
步骤2、密度指标建立:密度指标建立包括主成分分析法PCA处理和核密度估计KDE处理,通过主成分分析法PCA将步骤1的时间序列数据进行降维处理,将原本四维时间序列数据降至二维时间序列数据;通过核密度估计KDE处理对二维时间序列数据进行处理,处理好二维时间序列数据后将会得到每个微震数据的概率密度,然后根据每个时间段中选取其中最大的概率密度作为密度指标进行微震数据时序分析,得到大能量发生时间的一般规律,即选取这段时间段中70%以上的最大概率密度,当其中出现峰值时,推测出未来时间段是有大能量事件发生的,从而完成微震数据标签的构造,有大能量事件发生即为1,其他时间段数据标签构造为0,即无大能量事件发生;
步骤3、建立基于小样本学习的长短期记忆循环神经网络LSTM模型:使用长短期记忆循环神经网络LSTM对密度指标进行建模和特征提取,获取回归损失和数据特征;接着运用小样本学习原型网络,通过对长短期记忆循环神经网络LSTM处理的数据特征进行聚类并计算每个时间段中不同类别样本隐私特征的中心点,用欧式距离度量各个样本的隐表征向量和对应隐表征中心点的距离作为网络分类损失;最后在预测模块上,将上述损失连接,进行梯度回传和优化,完成基于小样本学习的深度学习模型构建,最终输出大能量矿震时间段的预测。
2.根据权利要求1所述的一种基于小样本学习的冲击地压时序预测模型构建方法,其特征在于,步骤1中的矿震数据处理为:
以固定时间窗口统计数据,构建时间序列数据集合,时间序列数据包括时间以及坐标位置X,Y,Z,然后将每个时间段内的时间序列数据进行标准化处理,将数据处理成均值为0、标准差为1的标准正态分布的数据,标准化处理具体方法如下:
平均值计算方法如下:
标准差计算方法如下:
式中:xi为第i个原始数据,包括第i个微震数据的时间以及坐标位置;
为原始数据的平均值;
σ(x)为原始数据的标准差;
xi'为原始数据更新后的数据;
n为时间段内包含的数据总量。
3.根据权利要求2所述的一种基于小样本学习的冲击地压时序预测模型构建方法,其特征在于,步骤2中的密度指标建立为:
主成分分析法PCA处理的方法是基于数据降维处理,将原来具有相关性的M个指标进行重新组合,形成一组新的彼此不相关的N个指标,重新组合后获得的N个指标是原来M个指标的线性组合且满足MN,用新的N个指标代替原来的M个指标作为模型的输入,进行后续分析,具体步骤如下:
假设有p条q维的标准化数据,首先将标准化数据按列组成q行p列的矩阵D,然后将矩阵D每一行进行零均值化,即减去这一行的均值,接着求出协方差矩阵根据求出的协方差矩阵求出特征值及其对应的特征向量,将特征向量按对应特征值大小从大到小按行排列成矩阵,取前k行组成矩阵P,最后E=PD即为降到k维后的数据;
将上述被主成分分析法PCA降维后的数据进行核密度估计KDE处理,核密度估计函数如下:
式中:K(.)为核函数;
h>0为一个平滑参数,称作带宽,也被成为窗口;
为缩放核函数;
在中,K函数内部的h分母用于调整核密度估计KDE曲线的宽幅,而K函数外部的h分母则用于保证曲线下方的面积符合核密度估计KDE的规则;
在选择合适的核函数及带宽后,核密度估计KDE能够模拟真实的概率分布曲线;
在核函数的选择上采用高斯函数,并根据西尔弗曼法则,宽带h的选择如下所示:
式中:n为时间段内包含的数据总量;
d为数据维度;
经过核密度估计KDE处理能够得到每个数据点的概率密度,通过将主成分分析法PCA坐标轴网格化,能够将每个时间段概率密度绘制在主成分分析法PCA坐标轴上。
4.根据权利要求3所述的一种基于小样本学习的冲击地压时序预测模型构建方法,其特征在于,步骤3中的建立基于小样本学习的长短期记忆循环神经网络LSTM模型,具体如下:
首先预测模型生成是基于步骤2处理后的密度指标所创建的训练数据集,构建时间序列数据集合,采取6h作为时间窗口统计数据,假设第i个时间窗口计算得到的数据记录为mi,其可以表示为:
式中:id为时间窗口编号;
为微震数据时间段中发生地点的平均值;
t为微震数据时间段范围内靠后的时间;
如时间段为0时到6时,t选取为6时刻;
将mi按照步骤1的方式进行标准化处理后得到的数据加入每个时间段对应的ρmax密度指标,构造成
当本时间段缺失数据时,将上一时间段数据对本时间段数据进行补充;
基于上述方法遍历时间窗口,得到时间数据序列数据集合M:
M=[m0,m1,m2,......,mn-1] (7)
时间段对应的标签集合T表示为:
T=[t0,t1,t2,......,tn-1] (8)
式中:ti为每个时间段,当所处时间段符合核密度估计KDE处理分析后的结果,则发生大能量事件,此时ti=1,否则ti=0;
同时基于小样本学习的深度学习模型如下:
基于小样本学习的深度学习模型包括卷积层、长短期记忆循环神经网络LSTM和小样本原型网络3个模块,数据集选择85%作为训练集,5%作为验证集,10%作为测试集;
卷积层如下:
数据首先流入卷积模块,用于解析20个微震事件间短程依赖关系以及事件5个属性间的关系,卷积核尺寸确定为6×5,卷积核数量为32个,卷积层激活函数选择为ReLU函数,其表达式如下:
ReLU(x)=max(0,x) (9)
卷积核运算过程如下所示:
hk=ReLU(Wk*X+bk) (10)
式中:Wk为第k个卷积核矩阵;
X为输入的时间序列矩阵;
bk为偏执;
*为哈密顿算子;
计算结果采用零填充法保证输入前后的维度一致;
长短期记忆循环神经网络LSTM如下:
卷积层的输出流入长短期记忆循环神经网络LSTM循环神经网络,长短期记忆循环神经网络LSTM用于挖掘微震事件序列之间的长程依赖关系;
对于每一个长短期记忆循环神经网络LSTM神经单元,输入当前时刻的数据xt、上一个时刻神经单元的输出ht-1以及上一个长短期记忆循环神经网络LSTM神经单元隐含的记忆状态Ct-1,对应输出为当前时刻的输出值ht以及当前时刻长短期记忆循环神经网络LSTM神经单元的记忆状态Ct;长短期记忆循环神经网络LSTM神经单元里有三个控制门:遗忘门、输入门和输出门;遗忘门对上一时刻的记忆状态Ct-1进行筛选保留,输入门决定了当前时刻的数据输入xt,有多少能够被记忆单元记忆,输出门控制记忆状态Ct有多少能够输出到当前时刻的输出ht中,遗忘门、输入门和输出门的状态公式分别如下:
遗忘门:
ft=σ(Wf·[ht-1,xt]+bf) (11)
输入门:
it=σ(Wi·[ht-1,xt]+bi) (12)
单元状态输入:
单元状态:
输出门:
ot=σ(Wo·[ht-1,xt]+bo) (15)
当前时刻隐状态输出:
ht=ot*tanh(Ct) (16)
式中:Wf、Wi、Wc、Wo表示权重矩阵;
bf、bi、bc、bo表示偏置向量;
tanh为激活函数;
σ表示sigmoid激活函数;
[]表示向量连接;
*为哈密顿算子;
小样本原型网络如下:
通过对长短期记忆循环神经网络LSTM提取的隐式特征进行聚类,并计算不同类别样本0和1的隐式特征中心点,通过把未知数据投影到聚类空间中,通过欧式距离计算各个未知数据的隐式特征向量和不同类别样本中心点的距离,对比目标到样本0和1隐式特征中心点的距离,运用Softmax得出属于每一个样本的概率,从而分析出目标的类别,同时将欧氏距离作为原型网络分类损失,在训练过程中不断最小化它和它对应类的距离,同时拉大它和其他类的距离,欧氏距离具体计算公式如下:
式中:x1和y1为各个样本的隐式特征向量的坐标;
x2和y2为对应隐式特征中心点的坐标;
训练过程具体如下:
将上述时间序列数据M放入长短期记忆循环神经网络LSTM训练,进行神经网络的构建并进行隐式特征的提取,结合小样本学习原型网络模块,通过加权交叉熵损失函数计算长短期记忆循环神经网络LSTM模型的损失值,将它与欧氏距离计算的损失值相加融合,采用递归回传的方法不断更新神经网络模型中的参数,使得模型在训练数据集上的损失最小化,训练过程中采用sgd作为优化器,运用准确率作为评价函数,超参数设置如下:训练轮次为100,批大小为400,衰减率为0.8,采用Softmax进行归一化处理,得到有无大能量事件发生的概率,如果有大能量事件概率大于无大能量事件概率,则输出1,反之输出0,最终完成模型的搭建,从而生成预测模型,采用的交叉熵损失函数如下:
式中:Li表示第i个前兆模式序列的损失值;
N表示前兆模式序列数量;
z0和z1分别表示两个类别的学习权重;
w0和w1分别表示类别0和1的样本分布权重;
若第i个前兆模式序列的标签为小能量事件,则yio=1,yi1=0,否则yio=0,yi1=1;
pi0为观测样本i为类别0的预测概率,pi1为观测样本i为类别1的预测概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国矿业大学,未经中国矿业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211708756.2/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理