[发明专利]基于对抗生成网络的恒星光谱小样本分类方法在审
申请号: | 202010014622.5 | 申请日: | 2020-01-07 |
公开(公告)号: | CN111242201A | 公开(公告)日: | 2020-06-05 |
发明(设计)人: | 余先川;刘伟;闫瑞清;朱猛;代聪;陈思莹;姚旺;詹英;田海峰 | 申请(专利权)人: | 北京师范大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100875 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 对抗 生成 网络 恒星 光谱 样本 分类 方法 | ||
本发明公开了一种基于对抗生成网络的半监督恒星光谱分类方法:该方法是基于已知训练样本较少情况下的分类方法。由于已知特定天体的光谱数量非常少,想要对特定天体的光谱进行分类,然而使用传统的基于机器学习和统计的分类方法需要大量已知的数据来训练分类模型。因此,本方法与监督方法不同,所提出的方法可以充分利用大量未标记的样本,其包含两部分:捕获数据分布的生成器和确定样本是否由实际数据组成的判别器。然后利用少量带标签的数据对训练好的判别器再进行训练,即可得到较好的分类模型。利用真实世界光谱数据,并且是光谱数据数量有限的情况下,评估模型的性能,实验结果表明该模型在分类精度方面优于其他方法。
技术领域:
本发明属于在训练数据量少的情况下的统计学习分类方法,具体是对恒星光谱数据的分类。
背景技术:
随着天文观测仪器的发展,近几十年来天文学中产生了越来越多的光谱数据,例如斯隆数字巡天,全球天体物理天体物理干涉仪和大型天空区多目标光纤光谱望远镜。恒星的分类有助于我们研究银河系的整体结构和演化。它对于检测特定的天体也是有效的。我们可以获得包含连续光谱带信息和紫外到红外波段范围的光谱数据。恒星光谱具有许多波段和连续光谱特征,有利于分类和识别。所以对特定天体的搜索和识别对天文学家来说具有重要的意义。
从数据处理和挖掘角度看,对于已有大量的标注信息的数据,我们可以用传统的有监督的学习方法,通过首先训练神经网络的模型,然后再对未知的观测数据进行分类。然而,针对特色天体和稀有天文现象,我们获得观测数据的数量很少。也就是说,与大量已知天体或者天文现象相比,特色天体和稀有天文现象所对应的观测数据属于小样本。因此,我们在海量观测数据中搜寻特色天体或者稀有天文现象,本质上是关于小样本或者样本不均衡的分类问题。使用传统的无监督的学习方法存在的问题是精度不高,所以用少量光谱提高分类器的准确度是一个具有挑战性的问题。
MK(Morgan等,1973)是一种广泛使用的光谱分类方法,它基于小规模标准恒星的光谱特征。MK系统基于恒星的温度从高到低,将恒星光谱分为七类。然而,MK星分类系统主要通过将光谱与少量标准恒星进行比较来手动完成,当光谱数量非常大时,这种分类效率低且不可靠。Bailer-Jones(1997)直接从观测到的光谱中使用物理参数来训练人工神经网络(ANN),这可以应用于光谱分类。BailerJones(2003) 倾向于使用模式识别算法并概述两种替代框架(并行和分层)进行分类,数据均来自Galactic调查任务 GAIA。广泛用于分类的监督方法可以充分利用先验知识来改善分类器的性能。然而,需要大量标记光谱来训练模型,并且获得大量标记光谱是耗时且昂贵的。而且,已知特定天体的光谱数量通常很小。
发明内容:
发明了一种基于对抗生成网络的恒星光谱小样本分类方法,利用对抗生成网络的强大特征学习能力,学习恒星光谱的特征。然后,利用少量带标签的数据微调网络,最终解决小样本下的不同恒星光谱分类问题。
基于对抗生成网络的恒星光谱小样本分类方法,该方法包括:
1)收集恒星光谱数据,对恒星光谱数据进行预处理,预处理数据使用z-score标准化方法对数据进行预处理。
2)使用未标记的真实光谱和由生成模型生成的伪光谱来训练生成对抗网络(GAN),其中训练的生成模型用来模拟生成一维的恒星光谱,训练的判别模模型用来判别恒星光谱是否是由生成网络所生成。
3)步骤2中,在训练生成对抗网络模型时,生成模型的输入是随机噪声pz(z)=μ(-1,1)。
4)步骤2中,在训练生成对抗网络模型时,生成模型使用上采样的方案获得与真实光谱相同尺寸的伪光谱。
5)步骤2中,在训练生成网络模型时,生成模型使用tanh激活函数来表示非线性,生成模型的最后一层连接到判别模型的输入层。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京师范大学,未经北京师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010014622.5/2.html,转载请声明来源钻瓜专利网。