[发明专利]一种基于点阵收缩的产区天气数据融合方法有效
申请号: | 201711317380.1 | 申请日: | 2017-12-12 |
公开(公告)号: | CN108038505B | 公开(公告)日: | 2020-07-03 |
发明(设计)人: | 彭伟民;陈爱红;陈婧;徐海涛 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 杭州奥创知识产权代理有限公司 33272 | 代理人: | 王佳健 |
地址: | 310018 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于点阵收缩的产区天气数据融合方法。本发明利用点阵结构的数据表示能力,将源数据集合的数据样本表示为点阵结点并组织成层次状的点阵结构。通过基于相邻位的点阵收缩方法,相似点阵结点以渐进的方式聚集。在点阵收缩结果的基础上,本发明提出相应的经典的和基于量子的产区天气数据融合方法。本发明可以以一种可控的方式实现产区天气数据的有效融合。 | ||
搜索关键词: | 一种 基于 点阵 收缩 产区 天气 数据 融合 方法 | ||
【主权项】:
1.一种基于点阵收缩的产区天气数据融合方法,其特征在于该方法包括如下步骤:1)基于相邻位和量子表示的点阵收缩对于源产区天气数据集X(=[s1 ,s2 ,…,si ,…,sn ]T )中的数据样本si ,其中的数据元素 来自L个不同的数据向量X1 ,X2 ,…,Xj ,…,XL ;L由产区天气属性个数决定;这里,X1 ,X2 ,…,Xj ,…,XL 分别表示如下产区天气属性:平均最大气温、平均最小气温、历史最大气温、历史最小气温、周平均气温、周气温偏差、周累计降雨量、周降雨量偏差、24小时最大降雨量、月累计降雨量、年累计降雨量、平均最大相对湿度、平均最小相对湿度、气温高于90°F天数、气温低于32°F天数、降雨量大于0.01英寸天数、降雨量大于0.5英寸天数;定义数据样本si 为 一周记录一次数据样本,产区天气数据集X包含某产区15年以上数据样本记录;若数据向量Xj 中的数据元素具有mj 个唯一取值,则数据元素 被量子化成含有mj 个量子位的量子态,即 其中,只有一个量子位等于|1>,它的下标与 在mj 个唯一取值顺序序列中的位序一致;当所有数据向量中唯一取值数m1 ,m2 ,…,mj ,…,mL 确定之后,数据样本si 被量子化成具有M个量子位的量子态;显然,每个量子化样本中有L个量子位等于|1>;点阵结构通过将量子化样本分布于全|0>量子态|00…0…00>和全|1>量子态|11…1…11>之间进行构造;点阵结构第一层只有一个含M个量子位|0>的结点且拥有M个孩子结点,第二层中每个结点拥有M-1个孩子结点且有一个量子位等于|1>,第三层中每个结点含拥有M-2个孩子结点且有两个量子位等于|1>,其他层的情况可依此类推;第(M/2+1)层拥有的点阵结点数最多;而含有L个量子位|1>的量子化样本位于第L+1层;以数据样本|si >为例,阐述基于相邻位的渐进式点阵收缩过程;数据样本si 的量子表示|si >由其包含的L个数据元素的量子表示组成;而含有mj 个量子位的量子化元素 具有如下表示: | x i j > = | b i j 1 b i j 2 ... b i j k j ... b i j m j > - - - ( 1 ) ]]> 其中,量子位 等于|0>或|1>;定义量子化数据样本|si >为: | s i > = | b i 1 1 b i 1 2 ... b i 1 k 1 ... b i 1 m 1 ... b i j 1 b i j 2 ... b i j k j ... b i j m j ... b i L 1 b i L 2 ... b i L k L ... b i L m L > - - - ( 2 ) ]]> 由于样本|si >的表达式由它包含的元素 的表达式组成,因而将|si >的收缩分解为所包含的元素的收缩;两个量子位 和 的收缩,可以通过受控操作来实现;具体来说,量子位 和 被当作非联合受控位,量子位|0>被当作目标位;若 或 等于|1>,则将X-门作用于目标量子位|0>;当一个数据向量中特定的属性值达到给定的阈值,此向量中数据元素的收缩结束;设定如下不等式作为基于相邻位的点阵收缩阈值; ( f r j - f r + 1 j ) / f r j ≤ 1 / 2 - - - ( 3 ) ]]> 其中, 表示第j个数据向量在第r轮点阵收缩包含的唯一数据元素的个数;若满足不等式(3),则继续点阵收缩过程,否则终止点阵收缩过程;即当唯一数据元素减少的速度小于点阵结点长度缩短速度时,点阵收缩过程才继续;2)基于相邻位和经典表示的点阵收缩基于相邻位和经典表示的点阵收缩原理与基于相邻位和量子表示的点阵收缩原理类似;将量子态替换成二进制态,则可获得经典的点阵结构,每个点阵结点包含M个二进制位;与两个量子位的收缩相比,两个二进制位的收缩可以通过逻辑或运算实现;由于点阵结点的收缩将导致一个数据向量中相似数据元素的聚合,因此一个数据向量中数据元素之间的差异在经过一轮收缩后扩大了;基于此,向量方差被当作收缩阈值的关键因子,它能够反映向量中结点之间的离散情况; v r + 1 j ≥ v r j - - - ( 4 ) ]]> 其中, 表示第j个数据向量在第r轮点阵收缩的方差;即若向量方差保持增长,则继续点阵收缩过程;3)基于量子的重复检测与数据融合根据公式(1)所示的数据元素的量子表示,数据元素 中量子位的下标1,2,kj ,…,mj 表示 所有唯一取值的序列编号;在 的收缩过程中,各量子位的下标保持不变;即经过一轮收缩之后, 的收缩结果 中量子位的下标值来自于 中量子位的下标值;为方便起见,数据元素 经过r轮收缩之后的结果设为 并具有如下定义形式: | x i j > ( r j ) = | ( b i j 1 ) ( r j ) ( b i j 2 ) ( r j ) ... ( b i j k j ) ( r j ) ... ( b i j 2 - r j · m j ) ( r j ) > - - - ( 5 ) ]]> 其中, 的情况可依此类推;对于 中的量子位,只有一个量子位等于|1>,将此量子位称为极点量子位并假设 等于|1>;随着向量中量子数据元素的收缩,两个数据元素中极点量子位之间的下标差距变得更小了;下面,以量子态|xi1 >和|xi2 >为例,展示两个极点量子位之间下标差距的变化;其中, 且|xi1 >和|xi2 >的下标序列为{1,2,…,8,…,15,16};显然,|xi1 >和|xi2 >的极点量子位为 和 收缩前, 和 之间的下标差距等于 经过一轮收缩之后,|xi1 >和|xi2 >变为|xi1 >′= 和 |xi1 >′和|xi2 >′的下标序列为{1,3,5,7,9,11,13,15};|xi1 >′和|xi2 >′的极点量子位为 和 且经过一轮收缩后 和 之间的下标差距等于 遵循同样的方式,|xi1 >′和|xi2 >′经过两轮收缩之后变为: 和 |xi1 >″和|xi2 >″的下标序列为{1,5,9,13},其中的极点量子位为 和 经过两轮收缩之后 和 之间的下标差距等于 极点量子位之间下标差距的变化表明,随着向量中数据元素的收缩,极点量子位之间下标差距保持减小,且r轮收缩后的减小量不小于r;为此,对于重复检测标准的设定,主要考虑下标差距的减小量和同一数据样本中数据元素的不同收缩轮数;设数据样本|si >的收缩结果为 |si >rdt 的极点量子位为 则 由|si >rdt 中数据元素 的极点量子位 组成; ( s i ) r d t p l = ( | b i 1 k 1 > p l ( r 1 ) , ... , | b i j k j > p l ( r j ) , ... , | b i L k L > p l ( r L ) ) - - - ( 6 ) ]]> 重复检测标准定义为: | i d x ( ( s i ) r d t p l ) - i d x ( ( s i ′ ) r d t p l ) | ≤ Σ j = 1 L r j - - - ( 7 ) ]]> 其中,rj 为第j个数据向量中数据元素的收缩轮数;若数据样本|si >和|si′ >满足不等式(7),则它们是一个子集上的重复数据;根据 的定义,可将表达式 转换成: | i d x ( ( s i ) r d t p l ) - i d x ( ( s i ′ ) r d t p l ) | = Σ j = 1 L | i d x ( | b i j k j > p l ( r j ) ) - i d x ( | b i ′ j k j > p l ( r j ) ) | - - - ( 8 ) ]]> 重复检测标准具有如下表示形式: Σ j = 1 L | i d x ( | b i j k j > p l ( r j ) ) - i d x ( | b i ′ j k j > p l ( r j ) ) | ≤ Σ j = 1 L r j - - - ( 9 ) ]]> 当一个子集中所有重复数据样本被确定之后,它们将被融合成一个单一的目标数据样本;对于一个子集中的源数据样本来说,需要统计每个向量中所有数据元素的观测概率;一个向量中具有最大观测概率的数据元素将被选作此向量的目标数据元素;以数据子集sst 中数据样本 的融合为例,展示基于量子的数据融合模型;其中,nt 表示子集sst 中数据样本个数;若源数据集被划分成T个子集,则n1 +…+nt +…+nT =n;数据样本 的融合可被分解成不同数据向量中数据元素的融合;设目标数据样本为|st >,它代表了子集sst 中源数据样本的融合结果;|st >中目标数据元素 为源数据样本 中源数据元素 的融合结果,且等于具有最大观测概率的源数据元素,即: 其中, 为数据元素 的观测概率;若将 表示成max(ptj ),则: | x t j > = | x t k j > | p ( | x t k j > ) = max ( p t j ) - - - ( 10 ) ]]> 在公式(10)中,k=1,…,ht ,…,nt ;4)经典的重复检测与数据融合对于经典的数据融合模型,关注焦点是融合结果的包容性;即,一个目标数据元素包含了所有相关的源数据元素的成分;以子集sst 中数据样本 为例,展示经典的数据融合模型;其中, 以子集sst 中源数据样本对应的目标数据样本为st ,且 对于数据向量Xj 中源数据元素 对应的目标数据元素 的计算,一种简单的方式就是采用加权平均策略; x t j = ( w t 1 j x t 1 j + ... + w th t j x th t j + ... + w tn t j x tn t j ) / ( w t 1 j + ... + w th t j + ... + w tn t j ) - - - ( 11 ) ]]> 其中, 为 的权值。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711317380.1/,转载请声明来源钻瓜专利网。
- 上一篇:一种填充密封膜的保温墙体
- 下一篇:一种甲醇汽油添加剂及其制备方法与应用