[发明专利]基于数据增强和集成学习的系外行星光变信号分类方法在审
申请号: | 202310201369.8 | 申请日: | 2023-01-16 |
公开(公告)号: | CN116049724A | 公开(公告)日: | 2023-05-02 |
发明(设计)人: | 廖慧萍;李玉祥;李君;陈星豪;杨雨晴;张涛 | 申请(专利权)人: | 哈尔滨工程大学 |
主分类号: | G06F18/24 | 分类号: | G06F18/24;G06F18/10;G06F18/213;G06F18/2413;G06N3/08;G06F18/25;G06F18/214;G06N20/20;G06N3/0464 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 150001 黑龙江省哈尔滨市南岗区*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 数据 增强 集成 学习 外行 星光 信号 分类 方法 | ||
1.一种基于数据增强和集成学习的系外行星光变信号分类方法,其特征在于:
将待分类的系外行星光变信号输入至预先构建的光变信号分类器,输出信号分类结果;
所述光变信号分类器的构建方法包括:
S1:拼接同一目标不同观测季度的光变信号数据,并对拼接后数据进行预处理;
S2:对预处理后的光变信号数据重采样到定长;
S3:将重采样后的数据集划分为训练集,测试集和验证集;
S4:分别采用过采样和欠采样对训练集进行数据增强,得到子训练集1和子训练集2;
S5:针对子训练集1和子训练集2分别搭建一维CNN网络模型,通过调整隐藏层层数、神经元个数、激活函数和模型优化器,优化网络;
S6:分别采用N折交叉验证获得最佳分类模型作为基分类器1和基分类器2;
S7:采用加权投票法组合基分类器得到光变信号分类器。
2.根据权利要求1所述的一种基于数据增强和集成学习的系外行星光变信号分类方法,其特征在于:所述对拼接后数据进行预处理包括缺失值处理、离群点处理、移动平滑处理和归一化处理。
3.根据权利要求1所述的一种基于数据增强和集成学习的系外行星光变信号分类方法,其特征在于:所述对预处理后的光变信号数据重采样到定长包括:将预处理后的信号重采样成n个点。数据长度小于n的信号采用线性插值补全,大于n的信号采用滑动窗口内取均值降采样。
4.根据权利要求1所述的一种基于数据增强和集成学习的系外行星光变信号分类方法,其特征在于:所述采用过采样对训练集进行数据增强包括:
步骤S4.1:初始化少数类样本空间Smin,n={x1,x2,…,xn},多数类样本空间Smax;
步骤S4.2:利用KNN算法确定样本xn最邻近的K个样本,记为Xnk={xn1,xn2,…,xnk};
步骤S4.3:随机选取Xnk中的m个样本(mk),将其分别与样本xn进行随机线性插值,合成接近原始数据分布的新少数类样本,新样本分布满足:
将过采样的少数类样本与原来多数类样本结合得到新子训练集1。
5.根据权利要求1所述的一种基于数据增强和集成学习的系外行星光变信号分类方法,其特征在于:所述采用欠采样对训练集进行数据增强包括:
步骤S4.a:初始化训练集D1={x1,x2,…,xn},样本点xi={xi1,xi2,…,xim},多数类样本空间Smax,簇的个数为c,欠采样的样本个数为N;
步骤S4.b:计算样本不同维度数据的权值:
其中,xir为第i个数据中第r个分量值的大小,并计算Smax中各样本间维度加权之后的欧氏距离:
其中,distw(xi,xj)是2个样本在m维度中计算的欧氏距离,两两样本点的距离之和:
步骤S4.c:计算出最小距离之和的样本被视为首个样本簇心点,将此样本视为第一个簇心,计算任意样本与第1个簇心之间的距离,取最大距离的样本为第2个簇心,以此类推,一直取到第c个簇心;
步骤S4.d:选取与簇心距离最小的N-c个样本,每个簇选取个样本,最终得到含有N个样本的样本集;
步骤S4.e:得到的欠采样多数类样本与原来的少数类样本结合的子训练集2。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工程大学,未经哈尔滨工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310201369.8/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置