[发明专利]一种GMM与LSTM结合的投资组合风险预测方法在审
申请号: | 201811217293.3 | 申请日: | 2018-10-18 |
公开(公告)号: | CN109523386A | 公开(公告)日: | 2019-03-26 |
发明(设计)人: | 程良伦;黄振杰;吴梓宏;王卓薇;邱安波 | 申请(专利权)人: | 广东工业大学 |
主分类号: | G06Q40/06 | 分类号: | G06Q40/06;G06Q10/04;G06Q10/06;G06N3/04;G06N3/08 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 林丽明 |
地址: | 510006 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 投资组合 风险预测 聚类 类簇 预处理 混合高斯模型 股票数据 降维处理 聚类结果 预测结果 平稳性 数据集 收益 预测 降维 三层 噪声 股票 评估 | ||
本发明公开了一种GMM与LSTM结合的投资组合风险预测方法,所述方法包括:收集股票数据,选取满足平稳性条件的非噪声股票序列,并对其进行预处理;采用PCA方法对数据进行降维处理,用混合高斯模型(GMM)对降维后的数据进行聚类;从聚类结果中选取类簇代表作为投资组合,并对类簇代表的数据集进行划分;采用三层LSTM模型对投资组合进行预测,对预测结果的收益和风险进行评估,通过多次聚类预测以产生高收益低风险的投资组合。本发明可以提高投资组合的选取效率和风险预测精度。
技术领域
本发明涉及金融量化计算领域,更具体地,涉及一种GMM与LSTM结合的投资组合风险预测方法。
背景技术
在投资组合方法中,如何在多达成百上千的股票品种中选择合适的资产组合是一个首要的问题,常用的数据统计分析方法在风险预测方面很难处理大量股票的情况下选出少量的股票作为合适的组合,并且存在效率低、精度低的缺陷,投资者需要更高效、更精准的投资组合与风险预测方法来得到高收益、低风险的股票组合。
目前人工智能技术在金融领域应用广泛,采用聚类的方法,可以识别出隐含在数据集中的特征间的关系,根据这些关系可以在成千上万个数据点中选出多类不同的数据集,对于投资组合,股票与股票之间的差异性越大,这些股票的组合的风险越可控、收益越高。但股票的品种增多到成百上千时,就难以找到股票之间的区别,混合高斯模型(GMM)可以精确量化数据集,无论数据集呈现何种规律,都可以通过多个单一高斯模型的混合进行拟合,并且对于长度较大的股票收益率序列数据,可以通过适当的降维提高聚类的效率。时间序列数据的挖掘在金融风险预测领域得到了广泛的应用。LSTM是一种时间递归神经网络,通过控制输入门、遗忘门和输出门的打开或关闭,使得循环神经网络(RNN)具备记忆前几次结果的功能,可以处理和预测时延较长的股票数据集,从而达到风险可控并降低风险的目的。针对上述情况,借助聚类的方法选取投资组合,并通过时间序列预测出组合风险,这种方法可以有效地帮助投资者选择出低风险高收益的投资组合。但是模型和参数的选择,以及如何结合聚类模型与预测模型,是目前的主要问题。
发明内容
本发明为克服上述现有技术所述的至少一种缺陷,提供一种GMM与LSTM 结合的投资组合风险预测方法。
本发明旨在至少在一定程度上解决上述技术问题。
本发明的首要目的是一种GMM与LSTM结合的投资组合风险预测方法
为解决上述技术问题,本发明的技术方案如下:
一种GMM与LSTM结合的投资组合风险预测方法,包括如下步骤:
S1:获取股票数据集,并计算其收益率,通过数据预处理,得到符合GMM模型输入格式的股票数据集;
S2:根据投资组合需要的股票支数n确定聚类核心数k,然后对S1中预处理后得到的数据集进行主成分成分分析,检查各维度的相关性,得到最优的维数d;对S1中经过数据预处理后的股票数据集进行PCA降维,使用GMM模型对降维后的数据集进行参数评估并进行训练,然后用训练后的GMM模型对降维后的数据集中的股票进行聚类;
S3:从步骤S2聚类结果中找到每个类别的分类中心作为该类的股票代表,对股票代表未降维的收益率序列进行XY数据集构造,将经过XY构造后的数据集按照M:N比例分成两份,N作为训练数据集,M作为测试数据集;
S4:建立三层LSTM模型并使用步骤S3中的训练数据集进行训练,使用训练后的LSTM模型对测试数据进行组合预测,通过计算预测值的均值以及预测值与实际值的方差加权平均,得到收益率期望以及风险值;
S5:判断步骤S4中得到的收益率期望以及风险值是否符合设定的评价指标,如不满足评价指标则修改步骤S2中的参数,重复S2-S4的步骤直至收益率期望和风险值达到指标。
进一步地,所述步骤S1中股票收益率计算公式如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811217293.3/2.html,转载请声明来源钻瓜专利网。