[发明专利]一种基于十六进制编码的时序数据聚集近似度量方法在审
申请号: | 201910610770.0 | 申请日: | 2019-07-08 |
公开(公告)号: | CN110297821A | 公开(公告)日: | 2019-10-01 |
发明(设计)人: | 何珍文;刘刚;田宜平;黄挺;李旸;孙亚博;龙仕容;赵洪;刘玉婷;乔璐楠;吴凡 | 申请(专利权)人: | 中国地质大学(武汉) |
主分类号: | G06F16/21 | 分类号: | G06F16/21 |
代理公司: | 武汉华旭知识产权事务所 42214 | 代理人: | 刘荣;江钊芳 |
地址: | 430074 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种基于十六进制编码的时序数据聚集近似度量方法,将地学时序数据,统一转换成TIO数据集,基于ITD方法将时序数据对象的相似性计算转换成为二维间隔点集平面上TIO点的简单空间范围查询,之后进一步对其降维,将原有直线等价为一个中值坐标点,将所在区域空间划分为十六等份,将每条时序数据按照十六进制表示,构造相应距离计算表,将该空间查询转换成为一些列结构简单的普通间隔对象之间的关系计算,将复杂的时序相似性计算问题转化成一系列简单的间隔算子的计算问题,在本地计算节点上快速构建局部时序相似性计算结果,最后采用规约算法对多个时序片段的局部相似性结果整合为完整的相似性查询结果返回。 | ||
搜索关键词: | 时序数据 相似性计算 十六进制编码 近似度量 规约 局部相似性 相似性查询 时序 范围查询 关系计算 计算节点 结果返回 结果整合 局部时序 距离计算 空间查询 快速构建 十六进制 时序片段 所在区域 统一转换 问题转化 间隔点 列结构 数据集 坐标点 算子 转换 二维 降维 算法 等价 | ||
【主权项】:
1.一种基于十六进制编码的时序数据聚集近似度量方法,其特征在于包括以下步骤:(1)将由N个全局时序对象组成的时序数据加载到内存;(2)对于每个全局时序对象,采用相似性邻近准则的时序划分方法将其按窗口阈值分割成M个时序片段;(3)对于每一个全局时序对象,根据相似性邻近原则,获取时间段[t(i‑1),t(i)]和[t(i),t(i+1)]上的时序片段,分别记为Segment(i)和Segment(i+1),i取值为1;(4)采用时序片段中最大值和最小值的点作为每个时序片段的最小边界矩形的对角线的两端点,并将两端点作为该时序片段的摘要Summaries,将两线段分别记为两个带有旋转角度的间隔对象TIOAB=(VA,VB,α)和TIOCD=(VC,VD,β),其中间隔对象TIOAB的参数包括线段端点VA、线段端点VB以及间隔对象TIOAB的旋转角度α,间隔对象TIOCD的参数包括线段端点VC、线段端点VD以及间隔对象TIOCD的旋转角度β;(5)将可变间隔对象AB和CD分别抽象表示为三维空间坐标点HAB=(VAB,α|,lAB)以及HCD=(VCD,α|,lCD),其中VAB表示可变间隔对象AB的中值点,lAB表示可变间隔对象AB的长度,将三维坐标点HAB和HCD转化为十六进制字符串,判断本次转换是否为第一次计算,如果是则先初始化生成距离度量表;如果不是,则查询对应的哈希表距离,记为D0,设s为可变间隔对象AB和可变间隔对象CD的长度的比值,即伸缩量,则TIOAB和TIOCD的相似性记为SIM(TIOAB,TIOCD)=aD0+b|α‑β|+c|s‑1|,其中a表示符号化变换因子,b表示伸缩变换因子,c表示伸缩变换因子;(6)通过2组以上给定相似值的样本数据,分别代入步骤(5)中相似性公式SIM(TIOAB,TIOCD)=aD0+b|α‑β|+c|s‑1|,选取传统欧式距离相似性计算方法得到样本数据的相似性结果,得到2组以上关于a、b、c的方程组,通过解方程得到符号化变换因子a、角度变换因子b以及伸缩变换因子c;(7)将TIOAB和TIOCD数据代入SIM(TIOAB,TIOCD)=aD0+b|α‑β|+c|s‑1|求得相似性;(8)采用规约算法对M个时序片段的局部相似性计算结果整合并作为结果返回。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国地质大学(武汉),未经中国地质大学(武汉)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910610770.0/,转载请声明来源钻瓜专利网。