[发明专利]访问路径的融合方法及装置有效
申请号: | 202010256325.1 | 申请日: | 2020-04-02 |
公开(公告)号: | CN111538756B | 公开(公告)日: | 2023-05-02 |
发明(设计)人: | 邵国林;欧阳瑜;李佳佳 | 申请(专利权)人: | 支付宝(中国)网络技术有限公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F18/25;G06F18/22 |
代理公司: | 北京国昊天诚知识产权代理有限公司 11315 | 代理人: | 朱文杰 |
地址: | 200120 上海市浦东新区中国*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 访问 路径 融合 方法 装置 | ||
1.一种访问路径的融合方法,所述方法包括:
获取目标业务所对应的历史业务数据;其中,所述历史业务数据包括每次执行所述目标业务时的访问路径,所述访问路径的各个节点为执行所述目标业务时所经历的页面;
根据所述历史业务数据挖掘所述目标业务所对应的第一频繁项集;其中,所述第一频繁项集包括支持度大于或等于第一设定阈值的频繁访问路径;
采用基于支持度的距离算法计算所述第一频繁项集中部分所述频繁访问路径之间的距离;
根据部分所述频繁访问路径之间的距离,确定所述第一频繁项集中各个所述频繁访问路径所对应的位置向量;
根据各个所述频繁访问路径所对应的位置向量,计算所述第一频繁项集中其余所述频繁访问路径之间的距离;其中,所述距离用于表征所述频繁访问路径之间的路径相似度;
根据所述距离对所述第一频繁项集中的所述频繁访问路径进行融合处理。
2.如权利要求1所述的方法,所述采用基于支持度的距离算法计算所述第一频繁项集中部分所述频繁访问路径之间的距离,包括:
针对所述第一频繁项集中的任意两个所述频繁访问路径,确定两个所述频繁访问路径融合后的父路径;
查找第二频繁项集中是否存在所述父路径;其中,所述第二频繁项集包括支持度大于或等于第二设定阈值频繁访问路径及各所述频繁访问路径所对应的支持度,且所述第二设定阈值小于所述第一设定阈值;
若存在,则根据所述父路径的支持度和两个所述频繁访问路径的支持度计算两个所述频繁访问路径之间的距离。
3.如权利要求2所述的方法,所述根据所述父路径的支持度和两个所述频繁访问路径的支持度计算两个所述频繁访问路径之间的距离,包括:
根据所述父路径的支持度和两个所述频繁访问路径的支持度,通过如下公式计算两个所述频繁访问路径之间的距离;
其中,在上述公式中,Li表示所述第一频繁项集中的第i条频繁访问路径,Lj表示所述第一频繁项集中的第j条频繁访问路径,Li+j表示频繁访问路径Li和频繁访问路径Lj的父路径,dist(Li,Lj)表示频繁访问路径Li和频繁访问路径Lj之间的距离,sup(Li)表示频繁访问路径Li的支持度,sup(Lj)表示频繁访问路径Lj的支持度,sup(Li+j)表示父路径Li+j的支持度,α表示系数。
4.如权利要求1所述的方法,所述根据部分所述频繁访问路径之间的距离,确定所述第一频繁项集中各个所述频繁访问路径所对应的位置向量,包括:
针对已采用基于支持度的距离算法计算出距离的任意两个所述频繁访问路径,确定两个所述频繁访问路径所对应的初始化位置向量;
调整两个所述频繁访问路径所对应的初始化位置向量,直至采用基于位置向量的距离算法计算得到的两个所述频繁访问路径之间的距离与采用基于支持度的距离算法计算得到的两个所述频繁访问路径之间的距离满足第一设定条件为止,将满足所述第一设定条件时的两个位置向量确定为两个所述频繁访问路径所对应的位置向量;其中,所述第一设定条件为采用基于位置向量的距离算法计算得到的距离与采用基于支持度的距离算法计算得到的距离的差值小于或等于设定值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(中国)网络技术有限公司,未经支付宝(中国)网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010256325.1/1.html,转载请声明来源钻瓜专利网。