[发明专利]一种折线滑动窗口累积差值对比分析相似程度的方法有效
申请号: | 201310656527.5 | 申请日: | 2013-12-06 |
公开(公告)号: | CN103761238B | 公开(公告)日: | 2017-05-03 |
发明(设计)人: | 王锦龙;范渊;杨永清 | 申请(专利权)人: | 杭州安恒信息技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 杭州中成专利事务所有限公司33212 | 代理人: | 周世骏 |
地址: | 310051 浙江省杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及行为关联分析业务领域,旨在提供一种折线滑动窗口累积差值对比分析相似程度的方法。该种根据行为关联分析业务中的数据信息自动生成的折线图表,首先,根据行为关联分析业务的要求和不同行为的数据分布特性,从行为关联分析业务数据库中提取数据信息,并基于这些数据信息自动生成折线图表;然后,通过对两条折线的耦合度、偏离度进行分析,获得LineA和LineB间的相似度的量化指标。本发明能够应用在行为关联分析业务中,可根据不同行为的数据分布特性,对于经过数据汇总得到的折线图表,进行进一步的比较分析,进而得到可量化的相似程度、偏离程度的评估指标;当然,还可以在更多的领域上,用于更广泛的分析用途。 | ||
搜索关键词: | 一种 折线 滑动 窗口 累积 差值 对比 分析 相似 程度 方法 | ||
【主权项】:
一种折线滑动窗口累积差值对比分析相似程度的方法,其特征在于,首先,根据行为关联分析业务的要求和不同行为的数据分布特性,从行为关联分析业务数据库中提取数据信息,并基于这些数据信息自动生成折线图表;然后,假定图表中的两条折线分别为LineA和LineB,其中LineA为先发折线,LineB为后发折线,折线上的采样点(x,y),X轴为时间,单位为指定的时间周期,Y轴为数量,单位为次,表示在x时间周期内,事件的发生次数为y次,LineA的采样点的X轴区间为[AXmin,AXmax],LineB的采样点的X轴区间为[BXmin,BXmax];获得LineA和LineB间的相似度的量化指标,具体包括以下步骤:步骤1):将折线LineA、LineB的每个采样点使用TypeNode类型变量保存,并将折线采用TypeNode类型变量的数组方式进行保存,即LineA的采样点数据保存在数组ArrNodesListA中,LineB的采样点数据保存在数组ArrNodesListB中,数组成员变量记为(xCur,yCur);所述TypeNode类型变量是指:成员变量为(x,y),且(x,y)中的x、y分别对应采样点的x坐标值和y坐标值,x、y是不小于0的整数;步骤2):结合分析LineA、LineB的X轴区间,将LineA、LineB的两个X轴区间进行合并,获得X轴合并区间[Xmin,Xmax],其中Xmin为LineA的最小x坐标值AXmin、LineB的最小x坐标值BXmin中的最小值,Xmax为LineA的最大x坐标值AXmax、LineB的最大x坐标值BXmax中的最大值;步骤3):创建新的采样点数据数组NewArrNodesListA、NewArrNodesListB,将数组长度调整为Xmax‑Xmin+1,并设定两个数组中的所有数组成员变量为TypeNode类型变量的NodeCur,即(xCur,yCur),对NodeCur进行初始化,设定NodeCur的成员变量xCur中的x为该数组成员变量对应的数组下标,设定NodeCur的成员变量yCur中的y为0;步骤4):遍历ArrNodesListA,将数组成员变量(xCur,yCur)对应的y成员变量的值,拷贝给NewArrNodesListA数组对应下标为(xCur‑Xmin)的数组成员变量的y成员变量;遍历ArrNodesListB,将数组成员变量(xCur,yCur)对应的y成员变量的值,拷贝给NewArrNodesListB数组对应下标为(xCur‑Xmin)的数组成员变量的y成员变量;步骤5):创建用于保存偏离度的变量AmpAcc,AmpAcc用于保存直接偏离累计值,并将AmpAcc初始化为0;创建用于保存偏离基数的变量AmpAccBase,AmpAccBase用于保存直接偏离累计值基准,并将AmpAccBase初始化为0;步骤6):对于步骤2得到中的X轴合并区间,设定分段长度为SegLen,SegLen的长度是不小于1,同时不超过Xmax‑Xmin+1;步骤7):创建分段游标SegCursor,即(xStt,xEnd),并将xStt初始化为0,将xEnd初始化为步骤6中设定的SegLen;步骤8):通过步骤7中设定的分段游标SegCursor,同时遍历步骤4中得到的两个采样点数据数组NewArrNodesListA、NewArrNodesListB:a)将NewArrNodesListA数组中,对应X轴时间段为[xStt,xEnd]的所有采样点的y成员变量累计,得到SumSegCursorA;b)将NewArrNodesListB数组中,对应X轴时间段为[xStt,xEnd]的所有采样点的y成员变量累计,得到SumSegCursorB;c)计算SumSegCursorB与SumSegCursorA的差的绝对值AbsAmpCursor,并将AbsAmpCursor累加到AmpAcc变量;d)将SumSegCursorA的绝对值累加到AmpAccBase变量;e)验证分段游标SegCursor的成员变量xEnd,若xEnd小于步骤2中确定的Xmax,则将xStt、xEnd分别进行加1递增,跳到步骤a中再次遍历;若xEnd等于步骤2中确定的Xmax,则结束遍历;步骤9):通过步骤8中得到的AmpAcc和AmpAccBase,利用以下公式即可获得两条折线间的相似度的量化指标:AmpPer=AmpAcc/AmpAccBase*100%;AmpFitPer=100%‑AmpPer;其中AmpPer是直接偏离百分比,AmpFitPer是直接耦合百分比。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州安恒信息技术有限公司,未经杭州安恒信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310656527.5/,转载请声明来源钻瓜专利网。