[发明专利]一种基于演化分割的金融时间序列特征表示方法及系统在审
申请号: | 202110360869.7 | 申请日: | 2021-04-02 |
公开(公告)号: | CN113127534A | 公开(公告)日: | 2021-07-16 |
发明(设计)人: | 陈鹏;刘雷;裴峥;高志升;罗航;甘智豪;封康 | 申请(专利权)人: | 西华大学 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06N3/12;G06Q40/04 |
代理公司: | 北京天奇智新知识产权代理有限公司 11340 | 代理人: | 王大刚 |
地址: | 610000 四川*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 演化 分割 金融 时间 序列 特征 表示 方法 系统 | ||
本发明涉及一种基于演化分割的金融时间序列特征表示方法及系统,包括数据获取处理模块用于从金融股票数据中获取一个特征向量组并对其中的每个特征向量单独进行标准化,计算得到前n个时刻的每个特征向量的平均值和标准差,进而取出特征向量之间的量纲差异;初步分割模块用于将时间序列TS中的数据以由小到大的序列进行排序后得到序列TSO,根据时间序列TSO中的数据数为奇数或者偶数进而对二分位数据点进行分割识别,得到多个分段数据;优化模块用于对分段数据进行合并优化和通过遗传算法进行优化。本发明在保证良好的分段表示结果和较低的分段误差的同时,保留了金融时间序列中重要的一些转折点。
技术领域
本发明涉及数据技术领域,尤其涉及一种基于演化分割的金融时间序列特征表示方法及系统。
背景技术
随着互联网技术以及网络通信技术的快速发展,4G/5G时代已经到来,在如今的海量数据中,包括不同行业,如金融、工业、医疗,航天气象等领域,有一种类型的数据是按照时间排序的一组随机变量,它通常是在相等间隔的时间段内依照给定的采样率对某种潜在过程进行观测的结果,而对这些数据进行特征表示是后续数据挖掘研究的基础。特征表示方法大致可分为以下几种类别:基于域变换的特征表示方法,如离散小波变换(DTW)、离散傅里叶变换(DFT)等;基于模型的特征表示方法,如ARM、基于隐马尔可夫模型的特征表示方法;基于分段的特征表示方法,如分段聚合近似,分段线性表示,符号聚合近似等。国内外的学者对时间序列数据挖掘技术在时间序列数据库中发现潜在的信息和价值投入越来越多的关注,研究成果已经成功被运用在金融、教育、经济、电子信息、航天气象、工业和医疗等领域中。
在金融领域的数据具有随着时间推移而不断增长的特点,数据的高维,动态,不确定性等特点阻碍了时间序列数据挖掘的效率,相比于一般时间序列金融时间序列具有高噪声、非平稳、非线性等特点。目前没有对金融时间序列的特殊点作较为详细的研究,而在金融交易中如股票,一些具有特殊意义的转折点本发明在特征表示的操作中应该给与保留,这些关键时刻的交易点能够指导用户在选择交易的最佳时期。通过对金融时间序列的一些特殊点的研究,如Yin等人提出的将局部极大值点与局部极小值点定义为转折点,Hu等人同时将拐点、阶跃点等能够反映时间序列趋势变化的相关时序点也作为转折点,Cun等人将重要感知点作为分隔点进行时间序列线性表示,还有Zhu等人将特征点(feature points)作为分割点进行时间序列特征表示,Zhan等人提出了一种新的基于TPs重要性的在线分割算法,在加入这些转折点不仅能够清晰地表明相关金融活动中关键交易的开始与结束,同时能够反映原时间序列的重要数据特征,可以给交易者在交易阶段良好的参考。而在这些方法中,都是对时间序列分段整体表示误差为主要参考指标,很少有对金融时间序列中分段特征表示得到的结果进行综合权衡,比如将金融时间序列特征表示得到的分段数与分段表示误差这两个指标做一个相乘的操作从而得到一个综合衡量指标,而且通常面对给定不同分段误差时,表示效率波动较大的问题,因此,如何根据金融时间序列中分段特征得到的结果进行综合权衡,是现阶段需要考虑的。
发明内容
本发明的目的在于克服现有技术的缺点,提供了一种基于演化分割的金融时间序列特征表示方法及系统,以统计学中二分位点为分割点对时间序列进行初步分割,再结合演化算法对上述线性分段结果进行优化,具有良好的降维效果,在整体分段表示误差与分段数的评价指标上表现较好。
本发明的目的通过以下技术方案来实现:一种基于演化分割的金融时间序列特征表示方法,所述表示方法包括:
数据获取处理步骤:从金融股票数据中获取一个特征向量组并对其中的每个特征向量单独进行标准化,计算得到前n个时刻的每个特征向量的平均值和标准差,进而取出特征向量之间的量纲差异;
初步分割步骤:将时间序列TS中的数据以由小到大的序列进行排序后得到序列TSO,根据时间序列TSO中的数据数为奇数或者偶数进而对二分位数据点进行分割识别,得到多个分段数据;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西华大学,未经西华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110360869.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:公路工程用的公路裂缝处理装置
- 下一篇:一种肽链水解试剂及其制备方法和应用