[发明专利]基于标准量化参数动态筛选海量数据的方法及其在金融证券领域的应用在审
申请号: | 201410122235.8 | 申请日: | 2014-03-30 |
公开(公告)号: | CN104123668A | 公开(公告)日: | 2014-10-29 |
发明(设计)人: | 曾盛敏 | 申请(专利权)人: | 广州天策软件科技有限公司 |
主分类号: | G06Q40/04 | 分类号: | G06Q40/04 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 510000 广东省广州*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 标准 量化 参数 动态 筛选 海量 数据 方法 及其 金融证券 领域 应用 | ||
技术领域
本发明涉及筛选数据的方法,尤其是一种基于标准量化参数动态筛选数据的方法,这种方法在金融证券领域能够被广泛的应用。
背景技术
人类进入“大数据”时代,随之而来的数据仓库、数据安全、数据分析、数据挖掘等等围绕大数据的商业价值的利用逐渐成为行业人士争相追捧的利润焦点。数据分析和数据挖掘被深入的研究并取得广泛应用的领域。所谓数据分析是指用适当的统计方法对收集来的大量第一手资料和第二手资料进行分析,以求最大化地开发数据资料的功能,发挥数据的作用;数据挖掘是指从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的非平凡过程。基于长期对大数据的应用,尤其是对金融证券领域数据的研究和应用发现,金融数据尤其是股票、期货等证券数据其具有三个显著的共性:一是数量化;二是数量化数据动态化;二是数量化数据符合统计学的概率分布。尽管对金融数据三个共性并不陌生,但是直接应用上述数据共性,系统化成为海量数据筛选方法指导并提供决策,这是个空白。以最为常见利用数量化数据选择股票为例,现有系统的操作是通过外部设置参数或阀值,直接从海量的数据中筛选标的股票,这种方法仅仅关注和应用了数据数量化的特点,而忽视了数据动态性以及符合统计学概率分布的特点,实际效果并不理想。
发明内容
本发明提供一种基于标准量化参数动态筛选数据的方法,这种方法充分考虑和应用了数据数量化、动态化以及符合统计学概率分布的特点,能够将从海量量化数据中筛选出符合标准量化参数筛选条件的数据。这种方法最为直接的应用就是金融证券领域,本发明还公开了应用基于标准量化参数动态选择股票组合的方法以及选择期货品种的方法。
为达到上述目的,本发明应用于在海量数据中量化分析筛选符合决策条件数据集合用于决策,其步骤包括:
(1)通过数据接收端接收数据源提供的海量数据;
(2)预处理海量数据,提取海量数据中的量化数据,编制整理形成量化数据仓库;
(3)形成标准量化参数作为筛选数据的筛选条件:选取量化数据中的一类数据,作为一个样本空间,根据概率分布计算样本空间中这类数据的标准差,然后计算样本空间标准差的倍数,以此数值与平均值之间形成的偏离数量关系作为筛选条件;
(4)利用步骤(3)形成的筛选条件,在样本空间中筛选出符合条件的数据集合并保存;
(5)循环步骤(3),选择量化数据中与上一次相异的另一类数据,计算形成另一标准量化参数,进而循环步骤(4)形成另一组数据集合;
(6)当根据步骤(3)至(5)形成至少一组数据集合后,将各组集合做交/并集合运算形成符合最终筛选条件的决策集合;
(7)输出决策集合,提供最后决策根据。
步骤(2)和步骤(3)之间可以通过外部设置参数对量化数据仓库的数据进行预筛选。
步骤(3)形成的标准量化参数表述三种形式:<1>大于平均值偏离标准差N倍;<2>小于平均值偏离标准差N倍;<3>介于平均值偏离标准差-N倍至-M倍之间或介于平均值偏离标准差+N倍至-M倍之间或介于平均值偏离标准差+N倍至+M倍之间。
倍数N和M在步骤(3)和步骤(4)之间通过外部预设赋值,倍数N和M为绝对值,正负号在于定义偏离是位于平均值的左侧或是右侧。通常的定义是正号表示偏离在平均值的右侧,负号表示偏离在平均值得左侧。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州天策软件科技有限公司,未经广州天策软件科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410122235.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:车装钻机转盘动力输入装置
- 下一篇:中药提取自动投料机构