[发明专利]一种基于可变间隔对象的时序数据相似性度量方法在审
申请号: | 201910610193.5 | 申请日: | 2019-07-08 |
公开(公告)号: | CN110334766A | 公开(公告)日: | 2019-10-15 |
发明(设计)人: | 何珍文;刘刚;田宜平;黄挺;李旸;孙亚博;龙仕容;赵洪;刘玉婷;乔璐楠;吴凡 | 申请(专利权)人: | 中国地质大学(武汉) |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F16/2458 |
代理公司: | 武汉华旭知识产权事务所 42214 | 代理人: | 刘荣;江钊芳 |
地址: | 430074 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种基于可变间隔对象的时序数据相似性度量方法,基本思路是将地学时序大数据统一转换成可变间隔对象数据集,基于间隔变换距离相似性度量方法将时序数据对象的相似性计算转换成为二维间隔点集平面上TIO点的简单空间范围查询,然后根据间隔关系算子理论将该空间查询转换成为一些列结构简单的普通间隔对象之间的关系计算,将复杂的时序相似性计算问题转化成一系列简单的间隔算子的计算问题,实现在本地计算节点上快速构建局部时序相似性计算结果。最后采用规约算法对多个时序片段的局部相似性结果整合为完整的相似性查询结果返回给查询用户,从而在整体上提高时序数据相似性计算性能。 | ||
搜索关键词: | 相似性计算 时序数据 相似性度量 可变间隔 时序 算子 规约 局部相似性 相似性查询 对象数据 范围查询 关系计算 计算节点 间隔关系 结果返回 结果整合 局部时序 空间查询 快速构建 时序片段 统一转换 问题转化 大数据 间隔点 列结构 转换 二维 算法 查询 | ||
【主权项】:
1.一种基于可变间隔对象的时序数据相似性度量方法,其特征在于包括以下步骤:(1)将由N个全局时序对象组成的时序数据加载至内存;(2)对于每个全局时序对象,采用相似性邻近准则的时序划分方法按窗口阈值分割成M个时序片段集合;(3)根据相似性邻近原则,获取第一条要处理的时序数据在两个时间段[t(i‑1),t(i)]和[t(i),t(i+1)]两个时序片段,分别记为Segment(i)和Segment(i+1),i取值为1;(4)采用时序片段中最大值和最小值的点作为每个时序片段的最小边界矩形的对角线的两端点,并将两端点作为该时序片段的摘要Summaries,将两线段分别记为两个带有旋转角度的间隔对象TIOAB=(VA,VB,α)和TIOCD=(VC,VD,β),其中间隔对象TIOAB的参数包括线段端点VA、线段端点VB以及旋转角度α,中间隔对象TIOCD的参数包括线段端点VC、线段端点VD以及旋转角度β;(5)设线段AB和CD的中心点距离即TIOAB和TIOCD的中心点距离为D0,s为线段AB与CD长度的比值,即伸缩量,则TIOAB和TIOCD的相似性记为SIM(TIOAB,TIOCD)=aD0+b|α‑β|+c|s‑1|,其中a表示距离变换因子,b表示角度变换因子,c表示伸缩变换因子;(6)通过2组以上给定相似值的样本数据,分别代入步骤(5)中相似性公式SIM(TIOAB,TIOCD)=aD0+b|α‑β|+c|s‑1|,选取传统欧式距离相似性计算方法得到样本数据的相似性结果,得到关于a、b、c的方程组,通过解方程得到符号化变换因子a、角度变换因子b以及伸缩变换因子c;(7)将TIOAB和TIOCD数据代入SIM(TIOAB,TIOCD)=aD0+b|α‑β|+c|s‑1|求得相似性;(8)采用规约算法对M个时序片段的局部相似性计算结果整合并作为结果返回。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国地质大学(武汉),未经中国地质大学(武汉)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910610193.5/,转载请声明来源钻瓜专利网。