[发明专利]一种基于多任务自监督学习的股票涨跌预测方法在审
申请号: | 202110271244.3 | 申请日: | 2021-03-12 |
公开(公告)号: | CN113159945A | 公开(公告)日: | 2021-07-23 |
发明(设计)人: | 应泽林;董涛;程大伟;杨芳洲;刘金;严一博;罗轶凤 | 申请(专利权)人: | 华东师范大学;上海瞰点科技有限责任公司 |
主分类号: | G06Q40/04 | 分类号: | G06Q40/04;G06Q10/04;G06Q30/02;G06N3/04;G06N3/08 |
代理公司: | 上海蓝迪专利商标事务所(普通合伙) 31215 | 代理人: | 徐筱梅;张翔 |
地址: | 200241 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 任务 监督 学习 股票 涨跌 预测 方法 | ||
1.一种基于多任务自监督学习的股票涨跌预测方法,其特征在于,该方法包括以下具体步骤:
步骤1:收集中国每个股票每日频度的交易数据,在收集好的每日频度交易数据中,按照连续k天的日频交易数据构建数段股票序列形成数据集,之后再按照时间的先后顺序将构建完成的数据集划分为训练集、验证集和测试集,并对训练集、验证集、测试集中的数据进行去极值、标准化的数据预处理操作,之后步骤的训练过程在训练集和验证集上进行,测试过程在测试集上进行;其中,所述交易数据为最高价、最低价、开盘价、收盘价、成交量及成交金额;
步骤2:从步骤1训练集中任意选取一段股票序列,称之为锚序列,再从训练集股票序列中通过采样的方式得到与锚序列关联的另一段序列,称之为样本序列,形成锚-样本序列对,其中采样的方式分为正采样和负采样;对于形成的锚-样本序列对,将其输入到基于Transformer和注意力机制的序列编码器中,编码得到锚序列的表征及样本序列的表征;
步骤3:依据正负采样的方式得到锚-样本序列对的正负样本标签;将编码得到锚序列的表征及样本序列的表征输入到前馈神经网络中,计算前馈神经网络的输出结果与正负样本标签之间的损失,通过反向传播优化前馈神经网络的参数,完成正负样本二分类的判别任务即为正负样本判别自监督辅助任务;
步骤4:依据锚序列和样本序列下一个交易日的价格涨跌变化同向性来形成锚样本序列对的价格变化同向性标签,将编码得到锚序列的表征及样本序列的表征输入到前馈神经网络中,计算前馈神经网络的输出结果与价格变化同向性标签之间的损失,通过反向传播优化前馈神经网络的参数,完成价格变化同向性二分类的判别任务即为价格变化同向性自监督辅助任务;
步骤5:依据锚序列和样本序列下一个交易日的成交量涨跌变化同向性来形成锚样本序列对的成交量变化同向性标签,将编码得到锚序列的表征及样本序列的表征输入到前馈神经网络中,计算前馈神经网络的输出结果与成交量变化同向性标签之间的损失,通过反向传播优化前馈神经网络的参数,完成成交量变化同向性二分类的判别任务即为成交量变化同向性自监督辅助任务;
步骤6:以步骤2中的序列编码器及步骤3、步骤4和步骤5的三种自监督辅助任务构建自监督学习模型,对自监督学习模型进行三种任务联合训练,得到三种任务对应的损失值,将所述对应的损失值用线性函数组合,作为自监督学习模型的总损失;
步骤7:将步骤6自监督学习模型中的序列编码器提取出来,利用所述序列编码器对训练集、验证集和测试集上连续k天的每日频率股票交易数据进行编码,得到序列数据的表征,将其定义为每日的表征因子;
步骤8:基于步骤7中得到的训练集中的每日表征因子,以股票序列下一日的价格涨跌作为任务标签,先通过长短期记忆神经网络编码得到隐层表征,取最后一个时间步的隐层表征通过前馈神经网络进行二分类任务,预测该股票序列下一日的价格上涨的概率;将预测的概率和实际的涨跌标签计算交叉熵损失,并通过反向传播进行训练,优化前馈神经网络的参数;
步骤9:利用步骤8训练完成的长短期记忆神经网络模型和前馈神经网络模型,对步骤7中得到的测试集中的每日表征因子进行下一日的股票价格涨跌预测,得到股票下一日涨跌的概率,概率越大表明下一日股票上涨的概率越高,反之则越低。
2.根据权利要求1所述的股票涨跌预测方法,其特征在于,步骤1所述的数据集划分:70%为训练集,10%为验证集,20%为测试集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华东师范大学;上海瞰点科技有限责任公司,未经华东师范大学;上海瞰点科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110271244.3/1.html,转载请声明来源钻瓜专利网。