[发明专利]一种基于卷积神经网络模型的股市预测方法在审
申请号: | 201910041449.5 | 申请日: | 2019-01-16 |
公开(公告)号: | CN109840626A | 公开(公告)日: | 2019-06-04 |
发明(设计)人: | 林鸿飞;徐博;杨亮;许侃;李恒超 | 申请(专利权)人: | 大连理工大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q40/06;G06F16/951;G06N3/04;G06N3/08 |
代理公司: | 大连星海专利事务所有限公司 21208 | 代理人: | 徐雪莲 |
地址: | 116023 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于卷积神经网络模型的股市预测方法,包括:S1、数据收集、S2、数据处理、S3、训练神经网络模型、S4、预测股市走势四大步骤。本发明通过采集和分析上市公司的财经新闻语料,并根据DJIA历史数据对财经新闻语料进行标注,将标注后的财经语料信息作为卷积神经网络模型输入值,从而经卷积神经网络模型的处理输出新闻标注的预测值,进而通过新闻标注的预测值即可预测DJIA的涨跌情况及股市走势。本发明经交叉验证可以达到65.5%的预测准确率。 | ||
搜索关键词: | 卷积神经网络 标注 预测 财经新闻 股市预测 股市走势 语料 训练神经网络 交叉验证 历史数据 模型输入 数据收集 语料信息 数据处理 准确率 采集 输出 分析 | ||
【主权项】:
1.一种基于卷积神经网络模型的股市预测方法,其特征在于,包括以下步骤:S1、数据收集:使用网络爬虫从财经网站获取上市公司的财经新闻语料,通过雅虎财经API接口爬取道琼斯工业平均指数的历史数据;包括以下步骤:S101、利用爬虫技术从财经网站上获取股票代码列表;S102、从财经网站上爬取所述股票代码列表中的上市公司在预设时间段内所对应的历史新闻网页数据,作为财经新闻语料;S103、通过雅虎财经API接口获取预设时间跨度内的道琼斯工业平均指数的历史数据,保存为DJIA历史数据;所述预设时间跨度大于所述预设时间段;S2、数据处理:从步骤S102爬取的财经新闻语料中提取每个上市公司的标题、正文保存为新闻文本语料,并使用DJIA历史数据的每日涨跌情况对新闻文本语料进行标注;包括以下步骤:S201、数据清洗:使用解析工具对财经新闻语料进行解析处理:先对财经新闻语料去除html标签,然后从中提取出新闻标题、正文以及日期,保存至本地作为新闻文本语料;S202、数据标注:根据步骤S103得到的DJIA历史数据,对所述股票代码列表中的上市公司逐一进行收盘价比对:当上市公司第t+1天的DJIA收盘价Pt+1,高于该公司第t天收盘价pt时,则将该公司第t天的新闻文本语料标注成+1;反之,当Pt+1低于pt时,标注该公司第t天的新闻文本语料为‑1,构成标注数据集;其中,t≥1;S3、训练神经网络模型:搭建卷积神经网络模型,利用已标注的新闻文本语料和DJIA历史数据训练股市预测模型;包括以下步骤:S301、基于深度学习框架,搭建卷积神经网络模型:首先将每一篇新闻文本语料中的词表示为词向量的形式;在卷积神经网络模型搭建过程中,以新闻文本语料中所有词的词向量的拼接向量作为输入,以标注财经新闻语料的预测值作为输出,通过监督学习过程训练模型参数;S302、模型调优:将步骤S202中的标注数据集按时间宽度切分为训练集和验证集,以准确率为评价目标进行模型的权重参数调节;所述权重参数调节的方法为:在模型训练过程中,采用反向传播算法和梯度下降策略迭代调节并修改神经网络的权重参数,拟合并减少模型的预测输出值与真实标签的误差,直到误差不再减少为止,得到股市预测模型。S4、预测股市走势:使用网络爬虫从财经网站获取上市公司当日的财经新闻语料,输入股市预测模型中预测当日DJIA的涨跌情况及股市走势;包括以下步骤:S401、预测股市走势,通过步骤S302得到的调节后的权重参数,基于标注数据集,重新训练股市预测模型,得到二次股市预测模型;S402、使用网络爬虫从财经网站获取上市公司当日的财经新闻语料,利用步骤S201的数据清洗后得到当日的新闻文本语料,将当日的新闻文本语料输入二次股市预测模型中,输出新闻标注的预测值,即可得到当日DJIA的涨跌情况,预测股市走势。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910041449.5/,转载请声明来源钻瓜专利网。
- 上一篇:一种快递员群路径导航的方法
- 下一篇:一种能源设备的评估方法及评估系统
- 同类专利
- 专利分类
G06 计算;推算;计数
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理