[发明专利]基于双向跨模态注意力网络模型的股价预测方法及系统在审
申请号: | 201811535943.9 | 申请日: | 2018-12-14 |
公开(公告)号: | CN109598387A | 公开(公告)日: | 2019-04-09 |
发明(设计)人: | 张伟;吴汇哲 | 申请(专利权)人: | 华东师范大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q40/04;G06Q50/00;G06N3/08;G06F16/332 |
代理公司: | 上海麦其知识产权代理事务所(普通合伙) 31257 | 代理人: | 董红曼 |
地址: | 200062 上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 网络模型 模态 文本数据 序列数据 注意力 股价预测 文本序列 预测目标 数据集 预处理 循环神经网络 注意力机制 股价趋势 离散数据 连续序列 向量特征 训练样本 词向量 三分类 双向的 验证集 建模 转化 文本 融合 学习 | ||
1.一种基于双向跨模态注意力网络模型的股价预测方法,其特征在于,所述方法包括如下步骤:
第一步,选取数据集,爬取股价闭市序列数据和相应的社交文本数据集,并对社交文本数据进行预处理;
第二步,针对社交文本数据,利用词向量将文本序列转化成向量特征表示;针对股价闭市序列数据,将连续股价闭市序列进行三分类处理,转化成离散数据表示;
第三步,对股价闭市序列数据和社交文本数据集分别利用循环神经网络进行建模,利用双向的跨模态的注意力机制融合两部分模块,分别学习提取与预测目标相关的股价闭市序列和社交文本序列;
第四步,切分数据集,利用训练样本学习网络模型的参数并利用验证集进行参数调优;
第五步,利用基于双向跨模态注意力的网络模型预测目标数据中的股价趋势。
2.根据权利要求1所述的股价预测方法,其特征在于,所述股价信息是指:爬取金融网站上标准普尔500指数上的股市收盘股价信息。
3.根据权利要求1所述的股价预测方法,其特征在于,所述社交文本信息是指社交平台上有关标准普尔500中股票的用户状态文本信息。
4.根据权利要求1所述的股价预测方法,其特征在于,所述第一步中,所述对社交文本数据进行预处理是指:对爬取的社交文本数据信息进行去停止词、特殊符号、链接的替换操作。
5.根据权利要求1所述的股价预测方法,其特征在于,所述第二步中,利用词向量将文本序列转化成向量特征表示,按照以下步骤生成:
(1)对文本预处理好的社交文本数据,利用词向量模型word2vec进行训练,学习出整个文本库中每个词的词向量表示;记词向量的维度为De;
(2)生成社交文本级别的向量表示;针对有关股票的某一条社交文本信息,根据已获取的词向量,对该条社交文本所有词的词向量的每一维进行平均池化操作,即,将该条社交文本中的Nword个词的维度为Nword*De词向量矩阵使用维度上的平均池化,得到一个De维的社交文本表示;
(3)生成天级别的向量表示;针对某一天的股票相关社交文本表示,根据所述步骤(2)的方法获取了Ntweet个社交文本的社交文本级别的向量表示后,针对Ntweet*De为维度的天级别的股票文本矩阵表示,在词向量的每一维上采用最大、最小和平均池化操作,得到一个3*De的该天的股票文本的向量特征表示。
6.根据权利要求1所述的股价预测方法,其特征在于,所述第二步中,将连续股价序列进行三分类处理是指:针对爬取的原始收盘股价序列特征,若当天的收盘价高于前一天的收盘价,则使用+1作为当天的股价特征表示,反之,则用-1作为当天的股价特征表示,若当天的收盘价与前一天的收盘价持平,则用0作为当天的股价特征表示,连续股价序列特征转化为了一个取自{+1,0,-1}的三分类序列特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华东师范大学,未经华东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811535943.9/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理