[发明专利]一种长短期策略多因子量化投资方法及装置在审
申请号: | 201910340352.4 | 申请日: | 2019-04-25 |
公开(公告)号: | CN110322347A | 公开(公告)日: | 2019-10-11 |
发明(设计)人: | 谢永红;黄雯;汪浩宇;张德政;栗辉 | 申请(专利权)人: | 北京科技大学 |
主分类号: | G06Q40/04 | 分类号: | G06Q40/04;G06Q40/06 |
代理公司: | 北京市广友专利事务所有限责任公司 11237 | 代理人: | 张仲波 |
地址: | 100083*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 股票 预测模型 历史数据 影响因子 训练集 构建 因子量化 投资 标签 金融投资 收盘价格 收益影响 量化 收益 预测 | ||
1.一种长短期策略多因子量化投资方法,其特征在于,包括:
获取股票历史数据,其中,所述股票历史数据包括:多种股票影响因子历史数据;
确定对股票收益影响大的若干个股票影响因子作为长、短期策略预测模型的影响因子组合;
根据股票历史数据中相邻两日收盘价格计算股票收益率,根据收益率确定股票标签;
根据确定的影响因子组合对应的历史数据和股票标签,分别构建长、短期策略训练集;
根据构建的长期策略训练集训练长期策略预测模型,并根据构建的短期策略训练集训练短期策略预测模型;
根据训练好的长、短期策略预测模型确定预测日当天量化投资的最佳投资股票组合。
2.根据权利要求1所述的长短期策略多因子量化投资方法,其特征在于,股票影响因子的类型包括:行情因子、财务因子、估值因子、规模因子以及技术因子。
3.根据权利要求1所述的长短期策略多因子量化投资方法,其特征在于,在确定对股票收益影响大的若干个股票影响因子作为长、短期策略预测模型的影响因子组合之前,所述方法包括:
去除股票历史数据中的空值;
对去除空值后的股票历史数据的每一列进行标准化,其中,标准化公式表示为:
其中,y1,y2,...,yn为标准化后的新序列,x1,x2,...,xn表示标准化前的原始序列,表示序列均值,s表示方差,n表示获取的股票的数目。
4.根据权利要求3所述的长短期策略多因子量化投资方法,其特征在于,所述确定对股票收益影响大的若干个股票影响因子作为长、短期策略预测模型的影响因子组合包括:
确定标准化后的股票影响因子历史数据对股票收益的影响程度;
按照影响程度从大到小,对股票影响因子进行排序;
将前N个股票影响因子作为长、短期策略预测模型的影响因子组合,其中,N为第一预设值。
5.根据权利要求1所述的长短期策略多因子量化投资方法,其特征在于,每只股票在第i-1天收盘时刻到第i天收盘时刻的收益率表示为:
6.根据权利要求1所述的长短期策略多因子量化投资方法,其特征在于,所述根据收益率确定股票标签包括:
针对长期策略预测模型,将第i天收益率大于等于第二预设值的股票在第i天的标签标记为第三预设值,将第i天收益率小于第二预设值的股票在第i天的标签标记为第四预设值;
针对短期策略预测模型,将第i天收益率大于等于第五预设值的股票在第i天的标签标记为第三预设值,将第i天收益率小于第二预设值的股票在第i天的标签标记为第四预设值。
7.根据权利要求1所述的长短期策略多因子量化投资方法,其特征在于,所述根据构建的长期策略训练集训练长期策略预测模型包括:
根据构建的长期策略训练集,分别使用多粒度级联森林算法、自适应提升算法以及梯度提升决策树和逻辑回归融合算法对长期策略预测模型进行训练,得到3种长期策略预测模型;
其中,针对任一只股票,使用3种长期策略预测模型分别对待预测日的股票进行预测,并对标签预测为第三预设值的概率进行算数平均,算数平均的结果作为当前支股票在待预测日盈利的概率。
8.根据权利要求1所述的长短期策略多因子量化投资方法,其特征在于,所述根据构建的短期策略训练集训练短期策略预测模型包括:
根据构建的短期策略训练集,分别使用支持向量机、线性回归算法以及随机森林对短期策略预测模型进行训练,得到3种短期策略预测模型;
其中,针对任一只股票,使用3种短期策略预测模型分别对待预测日的股票进行预测,并对标签预测为第三预设值的概率进行算数平均,其中,算数平均的结果为当前支股票在待预测日盈利的概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京科技大学,未经北京科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910340352.4/1.html,转载请声明来源钻瓜专利网。