[发明专利]一种基于社会网络聚类的股票指数跟踪预测方法及系统在审
申请号: | 201710100466.2 | 申请日: | 2017-02-23 |
公开(公告)号: | CN106897797A | 公开(公告)日: | 2017-06-27 |
发明(设计)人: | 刘海飞;许金涛 | 申请(专利权)人: | 南京大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q40/04;G06K9/62 |
代理公司: | 南京经纬专利商标代理有限公司32200 | 代理人: | 朱小兵 |
地址: | 210093 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 社会 网络 股票 指数 跟踪 预测 方法 系统 | ||
技术领域
本发明涉及一种证券数据分析处理方法及系统,尤其涉及一种基于社会网络聚类的指数复制模型构建技术,属于数据分析及预测技术领域。
背景技术
股票价格指数是通过对股票市场上一些有代表性的公司发行的股票价格进行平均计算和动态对比后得出的数值。股票价格指数能综合考察股票市场的动态变化过程,反映股票市场的价格水平,为社会公众提供股票投资和合法的股票增值活动的参考依据,这些有代表性的公司股票被笼统的称为成份股。比如,上证180指数和深证100指数就是沪、深股市中两个具有典型代表性的指数,而构成上述指数的股票就分别称为上证180指数成份股和深圳100指数成份股。成份股的选择主要考虑两条标准:一是成份股的市价总值要占在交易所上市的全部股票市价总值的相当部分;二是成份股价格变动趋势必须能反映股票市场价格变动的总趋势。
期现套利涉及股指期货市场和证券现货市场,能间接反映市场的有效性和成熟度,对提高两个市场的流动性和增强两个市场的价格发现功能具有重要意义。期现套利主要是对股指期货与现货之间基差进行套利。股指期货与对应现货间理论上具有稳定的均衡关系,但是现实中由于信息不对称、投资者情绪、市场波动等因素会出现股指期货价格相对于现货价格被高估或者低估的不平衡现象,而呈现动态均衡关系。可见,想要实现期现套利,主要取决于以下两个条件:一是股指期货的标的指数跟踪效果良好;二是指数基金流动性好,股指期货与现货的基差动态均衡。所以,指数复制(跟踪预测指数涨跌)是规避风险和套利投机中必不可少的操作手段。
目前的指数复制技术主要包括以下几种:
基于市值排序方法的指数复制:市值排序法是对标的指数(如沪深300指数)成份股按照日均市值降序排序,依次选取一定数量股票构建股票池,利用二次指数跟踪模型确定最优投资权重,进行标的指数的复制。
基于权重排序方法的指数复制:权重排序法是对标的指数成份股按照日均权重均值降序,依次选取一定数量股票构建股票池,利用二次指数跟踪模型确定最优投资权重,进行标的指数的复制。
现有基于成份股的指数复制技术,过多考虑的是市值因素和权重因素等,忽视了一些小市值股票在指数构成中的作用;选股的股票所属行业单一,分散化程度低;没有考虑股票间的关联性,股票的相关性较高。
发明内容
本发明所要解决的技术问题是:提出一种新的基于社会网络聚类的指数跟踪预测方法,在全面考虑个股间的关联性的条件下,通过聚类分析提取相关性较低且具有代表性的股票构建股票池进行指数复制研究。
本发明为解决上述技术问题采用以下技术方案:
一种基于社会网络聚类的股票指数跟踪预测方法,包括以下步骤:
(1)、从第三方数据库中采集上月和当月的指数以及成份股数据,并对数据进行清洗,得到能用于研究的样本内数据和样本外数据;所述样本内数据为指数及其成份股上月的前复权1分钟收盘价数据,所述样本外数据为指数及其成份股当月的前复权1分钟收盘价数据;
(2)、根据样本内数据构建训练模型,对成份股采用社会网络聚类模型构建股票池,并用指数跟踪优化模型确定最优权重;
(3)、将样本内训练得到的股票池和最优权重运用于样本外数据的指数跟踪,得到预测的指数。
进一步,本发明的基于社会网络聚类的股票指数跟踪预测方法,在步骤(1)中,对所有收盘价数据进行数据清洗,包括:剔除缺失严重的股票、删除第一天和最后一天停市或数据缺失的股票、删除所有股票和指数及期货缺失超过一半的时刻、对缺失数据进行线性插值补全、再次对首末存在缺失的时刻进行删除,最终得到研究的样本内、样本外数据。
进一步,本发明的基于社会网络聚类的股票指数跟踪预测方法,在步骤(2)中,是从成份股中提取相关性低且具有代表性的股票构建股票池,具体流程包括:用成份股间的相关系数计算度量距离,构建成份股间的社会网络,用自适应仿射传播聚类算法对网络进行聚类,提取每簇的聚类中心形成股票池。
进一步,本发明的基于社会网络聚类的股票指数跟踪预测方法,在步骤(2)中,所述指数跟踪优化模型是通过最优化模型实现股票池股票对标的指数的最优跟踪,具体为:用股票池股票的线性组合得到跟踪指数,以跟踪指数与标的指数的跟踪误差最小为目标,进行二次优化模型求解股票的最优线性组合,确定最优权重。
进一步,本发明的基于社会网络聚类的股票指数跟踪预测方法,在步骤(2)中,用成份股间的相关系数计算度量距离,构建成份股间的社会网络,用自适应仿射传播聚类算法对网络进行聚类,提取每簇的聚类中心形成股票池,具体如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710100466.2/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理