[发明专利]集合预测的智能选择方法在审
申请号: | 201510895823.X | 申请日: | 2015-12-07 |
公开(公告)号: | CN105447320A | 公开(公告)日: | 2016-03-30 |
发明(设计)人: | 黄翰;潘一佩 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06F19/00 | 分类号: | G06F19/00 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 何淑珍 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 集合 预测 智能 选择 方法 | ||
技术领域
本发明一般涉及数据统计与数据挖掘处理领域,具体涉及集合预测的智能选择方法。
背景技术
预测通过对客观事实历史和现状进行科学的调查和分析,由过去和现在去推测未来,由已知去推测未知,从而揭示客观事实未来发展的趋势和规律。我们不可能不进行预测而只是等到事情发生时再采取行动,因此,好的预测是非常有必要的。然而,进行预测时,没有单一一种预测方法会绝对有效。无论使用何种方法进行预测,预测的作用也是有限的,并不是完美无缺。
集合预测方法克服了单一预测的缺点,为真实的数据的预测提供了多个预测数据,但是集合预测给出的多个预测值有时差异很大,有些预测值对实际值的偏离非常大,我们需要一个好的方法来判断这些数据中哪些数据比较接近实际的值。本发明就是在这样的背景下提出了集合预测的智能选择方法,对集合预测数据进行再分析,挖掘出其中有用的信息。
目前集合预测在气象预测领域的应用非常广泛,运用本发明提出的方法,可以对集合预测的预测数据进行再分析,更加精确的为气象预测工作提供一定的帮助。
发明内容
本发明针对集合预测的预测数据进行再分析,应用统计和数据挖掘的分类方法,对历史数据进行分析,为未来的预测信息的利用提供帮助。本发明的目的在于从集合预测的多个数据中,选取出可能的与实际值误差最小的预测。具体技术方案如下。
集合预测的智能选择方法,其包括以下步骤:
(a)读取集合预测数据和每次对应的实际值;
(b)将预测数据看为一个无序向量,分别将实际值、预测数据的最大值、最小值、平均数、中位数、25分位点和75分位点这7个数跟预测数据进行7次作差;
(c)预先定义(b)中每次作差结果的分布有12种分布类型,得到每次作差对应的12种类型中的一种;
(d)将(c)中减去实际值的类型作为结果,其他6个类型组合成为一个编码,统计编码和结果的对应情况;
(e)验证方法有效性,用已有数据进行验证。
进一步地,步骤(a)中,预测数据分时间段给出,一段时间间隔给出一组预测数据;相对应的实际值为实际发生的情况,能通过测量得到。
进一步地,步骤(b)中,将预测数据的最大值、最小值、平均数、中位数、25分位点和75分位点与预测数据向量作差,因为这6个数能反映一组数据的分布情况;同时,将步骤(a)读取的实际值也与预测数据作差;作差结果仍为一维向量;所述7次作差得到7个一维向量;25分位点代表一组数据中的某个数,使得数据总数的25%的数小于这个数,中位数就是50分位点,75分位点同意义。
进一步地,步骤(c)包括以下步骤:
(c-1)对于作差结果的一维向量假设其维度为1*m,将其按大小排序,无序数据变为有序,对应到坐标轴上;
(c-2)假设一维向量中绝对值最大的为x,以0为坐标原点,2*x/m为间隔把坐标轴正负方向分别划分为m/2个区间,总共m个区间;
(c-3)若m为奇数,用一个1*m维的向量记录每个区间内点的个数;1~m/2代表坐标负方向各个区间落的点数目;m/2+1代表落在坐标原点的点数目;m/2+2~m代表坐标正方向各个区间落的点数目;若m为偶数,用一个1*(m+1)维的向量记录每个区间内点的个数;1~m/2代表坐标负方向各个区间落的点数目;m/2+1代表落在坐标原点的点数目;m/2+2~m+1代表坐标正方向各个区间落的点数目;
(c-4)将步骤(c-3)的向量对应到预先定义的12种类型中的一种,7次作差得到7个类型值。
进一步地,步骤(d)中,对于步骤(c)的结果,以减去实际值的类型为作为结果,其他6个类型组合成为一个编码,统计期间的所有编码和结果的对应情况,记入一个矩阵中。
进一步地,对于一组预测数据,实际值未知,执行步骤(b)除了减去实际值的处理,然后进行编码;查询步骤(d)统计的矩阵的结果,找出可能的减去实际值的分布类型;根据分布类型,在多个预测数据中找出3个对比实际值如降雨量的误差最小的预测数据;集合预测中,每组预测数据的个数显著大于3。
进一步地,该智能选择方法既能用历史数据进行验证,也能用于处理新的数据;在已知实际值的历史数据中,找出每次的预测数据中与对应的实际值的误差最小的,验证它在不在步骤(e)使用本方法找出的3个预测值中;在实际值未知的未来的时间段,用该智能选择方法找到其中3个可能的对比实际值的误差最小的预测数据。
与现有技术相比,本发明具有如下优点和技术效果:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510895823.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于LED点阵的电子名片
- 下一篇:一种探地雷达(GPR)数据分解的方法
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用