[发明专利]基于数据增强和集成学习的系外行星光变信号分类方法在审
申请号: | 202310201369.8 | 申请日: | 2023-01-16 |
公开(公告)号: | CN116049724A | 公开(公告)日: | 2023-05-02 |
发明(设计)人: | 廖慧萍;李玉祥;李君;陈星豪;杨雨晴;张涛 | 申请(专利权)人: | 哈尔滨工程大学 |
主分类号: | G06F18/24 | 分类号: | G06F18/24;G06F18/10;G06F18/213;G06F18/2413;G06N3/08;G06F18/25;G06F18/214;G06N20/20;G06N3/0464 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 150001 黑龙江省哈尔滨市南岗区*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 数据 增强 集成 学习 外行 星光 信号 分类 方法 | ||
本发明公开了一种基于数据增强和集成学习的系外行星光变信号分类方法,包括拼接同一目标不同观测季度光变信号数据,对数据进行预处理;对数据重采样到定长;将重采样后的数据集划分为训练集,测试集和验证集;分别采用过采样和欠采样对训练集进行数据增强,得到子训练集1和子训练集2;针对两个训练集分别搭建一维CNN网络模型,通过调整隐藏层层数、神经元个数、激活函数和模型优化器,优化网络;分别采用N折交叉验证获得最佳分类模型作为基分类器1和基分类器2;采用加权投票法组合基分类器得到光变信号分类器,根据信号分类器得到分类结果。本发明解决系外行星光变信号类别不平衡问题,使模型能够获得更多特征来提高泛化能力。
技术领域
本发明属于深度学习算法智能应用领域,涉及一种基于数据增强和集成学习的系外行星光变信号分类方法。
背景技术
随着望远镜建造技术与科技水平的发展,开启了以动态天文事件为研究对象的时域天文学时代。天文学家通过目标区域的时间序列数据,拟合光变信号,研究目标天体随时间的变化。海量数据要求数据处理管道对暂现源触发信号具有快速自动响应、自动观测、实时处理的能力。基于数据驱动的深度学习方法需要大量样本才能获得理想效果,然而在实际的凌星法搜寻系外行星获取的数据中,行星目标样本难以获得。
多类不平衡分类中,类重叠、噪声和多个少数类等问题降低了分类器的能力,可以从数据预处理级别和算法级别改进分类器。数据层面上可以通过数据预处理修改原始数据集,包括欠采样、过采样、混合采样等重采样方法从样本空间进行优化;算法层面上可以对分类算法进行改进或集成,使其更适应于不平衡数据分类的要求。
发明内容
针对上述现有技术,本发明要解决的技术问题是提供一种基于数据增强和集成学习的系外行星光变信号分类方法,将数据层面方法和算法层面法集成在统一框架进行使用,解决天文时序数据缺少正样本问题,满足多类不平衡下深度学习在天文时序领域的应用需求。
为解决上述技术问题,本发明的一种基于数据增强和集成学习的系外行星光变信号分类方法,将待分类的系外行星光变信号输入至预先构建的光变信号分类器,输出信号分类结果;
所述光变信号分类器的构建方法包括:
S1:拼接同一目标不同观测季度的光变信号数据,并对拼接后数据进行预处理;
S2:对预处理后的光变信号数据重采样到定长;
S3:将重采样后的数据集划分为训练集,测试集和验证集;
S4:分别采用过采样和欠采样对训练集进行数据增强,得到子训练集1和子训练集2;
S5:针对子训练集1和子训练集2分别搭建一维CNN网络模型,通过调整隐藏层层数、神经元个数、激活函数和模型优化器,优化网络;
S6:分别采用N折交叉验证获得最佳分类模型作为基分类器1和基分类器2;
S7:采用加权投票法组合基分类器得到光变信号分类器。
进一步的,所述对拼接后数据进行预处理包括缺失值处理、离群点处理、移动平滑处理和归一化处理。
进一步的,所述对预处理后的光变信号数据重采样到定长包括:将预处理后的信号重采样成n个点。数据长度小于n的信号采用线性插值补全,大于n的信号采用滑动窗口内取均值降采样。
进一步的,所述采用过采样对训练集进行数据增强包括:
步骤S4.1:初始化少数类样本空间Smin,n={x1,x2,…,xn},多数类样本空间Smax;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工程大学,未经哈尔滨工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310201369.8/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置