[发明专利]一种折线偏离方差累积对比分析相似程度的方法有效

专利信息
申请号: 201310656486.X 申请日: 2013-12-06
公开(公告)号: CN103729546B 公开(公告)日: 2017-02-22
发明(设计)人: 王锦龙;范渊;杨永清 申请(专利权)人: 杭州安恒信息技术有限公司
主分类号: G06Q30/02 分类号: G06Q30/02;G06F17/24;G06K9/62
代理公司: 杭州中成专利事务所有限公司33212 代理人: 周世骏
地址: 310051 浙江省杭*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明涉及行为关联分析业务领域,旨在提供一种折线偏离方差累积对比分析相似程度的方法。该种根据行为关联分析业务中的数据信息自动生成的折线图表,首先,根据行为关联分析业务的要求和不同行为的数据分布特性,从行为关联分析业务数据库中提取数据信息,并基于这些数据信息自动生成折线图表;然后,通过对两条折线的耦合度、偏离度进行分析,能够得到量化的耦合度、偏离度指标的相似程度。本发明能够应用在行为关联分析业务中,可根据不同行为的数据分布特性,对于经过数据汇总得到的折线图表,进行进一步的比较分析,进而得到可量化的相似程度、偏离程度的评估指标;当然,还可以在更多的领域上,用于更广泛的分析用途。
搜索关键词: 一种 折线 偏离 方差 累积 对比 分析 相似 程度 方法
【主权项】:
一种折线偏离方差累积对比分析相似程度的方法,其特征在于,首先,根据行为关联分析业务的要求和不同行为的数据分布特性,从行为关联分析业务数据库中提取数据信息,并基于这些数据信息自动生成折线图表;然后,假定图表中的两条折线分别为LineA和LineB,其中LineA为先发折线,LineB为后发折线,折线上的采样点(x,y),X轴为时间,单位为指定的时间周期,Y轴为数量,单位为次,表示在x时间周期内,事件发生次数为y次,LineA的采样点的X轴区间为[AXmin,AXmax],LineB的采样点的X轴区间为[BXmin,BXmax];折线偏离方差累积对比分析相似程度的方法,获得LineA和LineB间的相似度的量化指标,具体包括以下步骤:步骤1):将折线LineA、LineB的每个采样点使用TypeNode类型变量保存,并将折线采用TypeNode类型变量的数组方式进行保存,即LineA的采样点数据保存在数组ArrNodesListA中,LineB的采样点数据保存在数组ArrNodesListB中,数组成员变量记为(aCur,bCur);所述TypeNode类型变量是指:成员变量为(x,y),且(x,y)中的x、y分别对应采样点的x坐标值和y坐标值,x、y是不小于0的整数;步骤2):结合分析LineA、LineB的X轴区间,将LineA、LineB的两个X轴区间进行合并,获得X轴合并区间[Xmin,Xmax],其中Xmin为LineA的最小x坐标值AXmin、LineB的最小x坐标值BXmin中的最小值,Xmax为LineA的最大x坐标值AXmax、LineB的最大x坐标值BXmax中的最大值;步骤3):创建新的采样点数据数组NewArrNodesListA、NewArrNodesListB,将数组长度调整为Xmax‑Xmin+1,并设定两个数组中的所有数组成员变量为TypeNode类型变量的NodeCur,即(aCur,bCur),对NodeCur进行初始化,设定NodeCur的x成员变量为该数组成员变量对应的数组下标,设定NodeCur的y成员变量为0;步骤4):遍历ArrNodesListA,将数组成员变量(aCur,bCur)对应的y成员变量的值,拷贝给NewArrNodesListA数组对应下标为(aCur‑Xmin)的数组成员变量的y成员变量;遍历ArrNodesListB,将数组成员变量(aCur,bCur)对应的y成员变量的值,拷贝给NewArrNodesListB数组对应下标为(aCur‑Xmin)的数组成员变量的y成员变量;步骤5):创建两个用于保存偏离度的变量AmpAcc和SqrAcc,AmpAcc用于保存直接偏离累计值,SqrAcc用于保存方差偏离累计值,并将AmpAcc和SqrAcc初始化为0;创建两个用于保存偏离基数的变量AmpAccBase和SqrAccBase,AmpAccBase用于保存直接偏离累计值基准,SqrAccBase用于保存方差偏离累计值基准,并将AmpAccBase和SqrAccBase初始化为0;步骤6):对于步骤2)得到中的X轴合并区间,设定分段长度为SegLen,SegLen的长度是不小于1,同时不超过Xmax‑Xmin+1;步骤7):将步骤4)中得到的NewArrNodesListA、NewArrNodesListB的所有采样点,按照步骤6)中确定的分段长度SegLen进行汇总分段,设定第n个分段为Seg_n,Seg_n对应X轴合并区间的X轴时间段为[SegLen*n,SegLen*n+SegLen‑1]区间,对于每个分段Seg_n,形成一个新的采样点,即TypeNode类型的NodeSegC,NodeSegC的x成员变量为当前分段的序号n,NodeSegC的y成员变量分别对应为NewArrNodesListA、NewArrNodesListB在分段Seg_n中,对应X轴时间段区间中的所有采样点的y成员变量的累加值,依此类推,最终得到数组成员变量为NodeSegC的新的采样点数组ArrSegNodesListA和ArrSegNodesListB,即得到采样点数组为ArrSegNodesListA的汇总折线LineSA和采样点数组为ArrSegNodesListB的汇总折线LineSB;其中n是不小于0的整数,且从0开始;步骤8):对ArrSegNodesListA、ArrSegNodesListB,按照数组下标进行遍历,进行以下操作:a)假定当前分段为SegC,将ArrSegNodesListA与ArrSegNodesListB在SegC分段的两个采样点的y成员变量,进行相减然后取绝对值获得直接偏离AmpC,对AmpC进行乘方获得方差偏离AmpS;b)将AmpC加到AmpAcc上,实现AmpAcc对于所有分段的直接偏离的累计;c)将AmpS加到SqrAcc上,实现SqrAcc对于所有分段的方差偏离的累计;d)提取ArrSegNodesListA的当前采样点的y成员变量的取值的绝对值,并赋值给变量AbsValC,将AbsValC累加到AmpAccBase上,将AbsValC的乘方累加到SqrAccBase上,获得两个偏离指标基准AmpAccBase和SqrAccBase;步骤9):通过步骤8)中得到的AmpAcc、AmpAccBase、SqrAcc和SqrAccBase,利用以下公式即可获得两条折线间的相似度的量化指标:AmpPer=AmpAcc/AmpAccBase*100%;SqrPer=SqrAcc/SqrAccBase*100%;AmpFitPer=100%‑AmpPer;SqrFitPer=100%‑SqrPer;其中AmpPer是直接偏离百分比,SqrPer是方差偏离百分比,AmpFitPer是直接耦合百分比,SqrFitPer是方差耦合百分比。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州安恒信息技术有限公司,未经杭州安恒信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201310656486.X/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top