[发明专利]一种螺纹钢期货价格涨跌概率预测方法在审
申请号: | 201811403947.1 | 申请日: | 2018-11-23 |
公开(公告)号: | CN109658241A | 公开(公告)日: | 2019-04-19 |
发明(设计)人: | 周振华 | 申请(专利权)人: | 成都知道创宇信息技术有限公司 |
主分类号: | G06Q40/04 | 分类号: | G06Q40/04;G06Q30/02;G06Q10/04;G06F17/18 |
代理公司: | 成都信博专利代理有限责任公司 51200 | 代理人: | 卓仲阳 |
地址: | 610000 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 螺纹钢 期货价格 叶节点 概率预测 损失函数 父节点 第三方数据库 最小化准则 保留信息 平方误差 人工分析 特征数据 信息增益 统计分析 合并 大数据 多维度 决策树 剪枝 预测 递归 减小 拟合 互联网 概率 重复 学习 | ||
1.一种螺纹钢期货价格涨跌概率预测方法,其特征在于,包括以下步骤:
(1)、学习样本数据收集;包括从互联网上爬取数据和从第三方数据库采购数据;
(2)、数据入库:获取数据后,将数据存入数据库,入库时整理并计算好所有特征值,以便后续用作训练与测试数据;
(3)、数据特征选取与计算
取出数据库中连续一段时间的数据作为训练数据集D;取另一段与数据集D不重复的数据作为测试数据集T;输入训练数据集D和特征A;
分别计算数据集D的经验熵H(D)、特征A对数据集D的经验条件熵H(D|A)、信息增益g(D,A)、信息增益比gR(D|A);
(4)、决策树模型生成与剪枝
采用CART算法与平方误差最小化准则生成决策树,CART假设决策树是一个二叉树,通过递归地二分每个特征,将特征空间划分为有限个单元,并在这些单元上确定预测的概率分布;构建完决策树后,对决策树进行减枝,将噪声节点移除;决策树的剪枝通过极小化决策树整体的损失函数来实现;
(5)、模型测试:输入之前准备好的测试数据集T,并比对模型输出与目标值间的误差值,衡量模型训练结果的好坏;当预测准确率超过70%,用于下一步训练;
(6)、轮训:将数据仓库中的老数据分为多组训练样本测试数据完成多轮训练,并持续获取未来产生的新数据作为训练样本与测试数据,重复2-5步骤反复迭代模型轮训,提高精度达到指定值,输出模型;
(7)、输入最新数据集,输出螺纹钢未来期货价格涨跌预测结果。
2.根据权利要求1所述的一种螺纹钢期货价格涨跌概率预测方法,其特征在于,所述从互联网上爬取数据,是使用定时脚本爬取对应页面并解析,将解析后的数据存入数据库;定时爬取与解析数据的脚本,可使用Python的requests,celery,beautifulsoup4实现;所述从第三方数据库采购数据,包括免费和付费使用;
所述数据包括港口库存数据、注册仓单数据、现货数据、期货数据和基差数据;将数据清洗整理并按天为单位合并后存入数据库;
当某种数据采样时间单位小于一天时,取当天所有数据的平均值;
不使用任何采样时间单位大于一天的数据。
3.根据权利要求2所述的一种螺纹钢期货价格涨跌概率预测方法,其特征在于,所述特征值计算公式如下:
港口库存变化量=港口库存量-港口库存量前值
注册仓单变化量=注册仓单量-注册仓单前值
基差=现货价格-期货价格
基差率=基差/现货价格
相对基差=基差-平均基差
相对基差率=相对基差/现货价格
其他特征直接来源于数据库数据值;
所述其他特征包括现货3日均价,现货7日均价,现货15日均价,现货30日均价。
4.根据权利要求2所述的一种螺纹钢期货价格涨跌概率预测方法,其特征在于,所述特征选取,其中期货价格数据作为模型输出,其他特征数据作为模型输入;当前数据集D样本容量为|D|,有k个类别Ck,|Ck|为类别Ck的样本个数,某一特征A有n个不同的取值a1,a2,……,an;根据特征A的取值可将数据集D划分为n个子集D1,D2,……,Dn,|Di|为Di的样本个数,并记子集Di中属于类Ck的样本的集合为Dik,|Dik|为Dik的样本个数。
5.根据权利要求4所述的一种螺纹钢期货价格涨跌概率预测方法,其特征在于,所述数据集D的经验熵H(D)计算式为
熵值表达了该数据样本的随机性,即混乱程度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都知道创宇信息技术有限公司,未经成都知道创宇信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811403947.1/1.html,转载请声明来源钻瓜专利网。