[发明专利]一种基于改进随机森林算法的股票收益率预测方法在审
申请号: | 201910180723.7 | 申请日: | 2019-03-11 |
公开(公告)号: | CN110059852A | 公开(公告)日: | 2019-07-26 |
发明(设计)人: | 方昕;陈玲玲 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q10/06;G06Q40/04;G06K9/62;G06N3/00 |
代理公司: | 杭州君度专利代理事务所(特殊普通合伙) 33240 | 代理人: | 朱月芬 |
地址: | 310018 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 随机森林 股票 算法 趋势预测 特征选择 预测 粒子群算法 参数选择 分类性能 趋势变化 属性特征 算法优化 特征属性 特征子集 网格搜索 预测性能 分类 准确率 维度 剔除 改进 筛选 引入 重复 优化 | ||
本发明公开了一种基于改进随机森林算法的股票收益率预测方法,本发明针对股票收益率分类预测时,随机森林存在的参数选择困难以及分类性能问题,RF算法本身无法识别并选择更高效的特征的缺点,结合粒子群算法优化特征选择机制,在趋势变化初期不明显的情况下,筛选出最优特征,且作为属性输入RF算法,提出PSO‑GRID‑RF股票趋势预测的混合方法;本发明缩小了特征子集,剔除无关或效果重复的特征属性,降低了输入的维度,减少了股票趋势预测的时间;在多属性特征环境下,提出高效特征选择方法,同时引入网格搜索算法优化随机森林参数,从而提高随机森林的分类预测性能,大幅度提高了股票趋势预测的准确率。
技术领域
本发明属于金融数据挖掘技术领域,针对股票收益率的分类预测研究中随机森林存在的参数选择困难以及分类性能问题,提出了一种基于粒子群算法的特征选择和网格搜索算法优化随机森林的参数的新算法。通过粒子群算法对训练集进行特征选择,剔除去除指标体系中的冗余指标以降低输入维度,同时引入网格搜索算法优化随机森林参数,从而提高随机森林的分类预测性能。
背景技术
在股票市场中,对于投资者来说,股票价格走势的预测一直是热门问题。准确判断和把握整个股票市场的变化趋势,不仅可以减少股票市场中盲目投资的现象,对于提高股市中投资者的理性程度具有较高的现实意义,更可以为国家制定相关经济政策提供参考。
国内外学者对股票价格预测进行了深入的研究,提出了各种预测方法。现在应用的方法主要有两种,基本面分析和技术分析。第一类是基于对公司成长性和盈利能力等基本因素的考虑。第二类是基于过去股票数据的数学分析,这种简单的分析是通过观察股票运动趋势图来进行预测。更复杂的分析是采用复杂的统计方法和机器学习算法。
时间序列分析是最先应用于股票价格预测的方法,对股票开盘价格建立ARMA模型进行短期预测。由于受到各种因素的影响,股票价格呈现出非线性变化,基于线性模型的时间序列分析法不能很好地反映股票非线性变化规律,预测精度低,应用受限。随着人工智能技术的兴起,BP神经网络因为其强大的非线性映射能力被广泛应用在股票价格预测中.基于BP神经网络的股票价格预测模型SPPM,对股票价格建立多个神经网络模型进行预测.神经网络在非线性的股票预测中取得了良好的效果,但同时存在着学习记忆不稳定,收敛速度慢,容易陷入局部最优值的问题。
随机森林算法(Random Forest)作为一种分类技术已经在金融领域中得到了应用,相较于支持向量机(Support Vector Machine)和人工神经网络(Artificial NeuralNetworks),RF在股票趋势预测中得到更好的结果。随机森林算法是一种模型组合,应用到不同的领域上均获得不俗的成果。基于随机森林算法具有训练速度快、模型泛化能力强等优点,将该算法运用到股票涨跌预测中,能够避免上述预测模型的不足。随机森林法预测主要是先对建立的初始指标体系进行筛选,将筛选后的指标数据作为影响变量代入到随机森林中,涨跌情况作为响应变量输出。但现有方法对随机森林本身的模型优化有所欠缺,不能进一步提升预测精确度。
发明内容
本发明针对在股票收益率的分类预测研究中技术的不足,提出了一种基于改进随机森林算法的股票收益率预测方法。
一种基于改进随机森林算法的股票收益率预测方法,具体包括以下步骤:
步骤1:数据获取,通过网站获取股票日数据;
将数据分为训练集,验证集,测试集
步骤2:获取数据进行指数平滑:
S0=Y0 t=0 (1)
St=α*Yt+(1-α)*St-1 t>0 (2)
式中:St表示时间t的平滑值,Yt表示时间t的实际值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910180723.7/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理