[发明专利]一种基于web数据的用户操作轨迹分析方法及装置有效
申请号: | 201811453609.9 | 申请日: | 2018-11-30 |
公开(公告)号: | CN111258874B | 公开(公告)日: | 2023-09-05 |
发明(设计)人: | 乔柏林;叶晓龙;任赣;竺士杰;蒋通通;胡林熙;邱佳;孟震 | 申请(专利权)人: | 中国移动通信集团浙江有限公司;中国移动通信集团有限公司 |
主分类号: | G06F11/36 | 分类号: | G06F11/36 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王莹;李相雨 |
地址: | 310016 *** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 web 数据 用户 操作 轨迹 分析 方法 装置 | ||
1.一种基于web数据的用户操作轨迹分析方法,其特征在于,包括:
实时获取用户操作轨迹,所述用户操作轨迹至少包括业务类型;
根据预先通过聚类算法获取的轨迹模型,将所述用户操作轨迹与具有相同业务类型的所有默认轨迹进行比对;其中,所述轨迹模型包括与每种业务类型对应的至少一条默认轨迹;
若所述用户操作轨迹与默认轨迹不同,则将所述用户操作轨迹标记为异常轨迹;
采用聚类算法,根据不同维度条件,将所有的用户操作轨迹进行归类汇聚,根据对聚类算法的具体设置得到一个簇集,其中至少包括一个簇;
所述聚类算法为K-Means聚类算法,K-Means算法通过预先设定的K值及每个类别的初始质心对相似的用户操作轨迹进行划分,并通过划分后的均值迭代优化获得最优的聚类结果;
使用误差平方和作为聚类的目标函数,两次运行K均值产生的两个不同的簇集,误差平方和越小相似度越高,从而在误差平方和最小时的簇集为最终的结果;其中所述K值根据业务类型的数量来进行设定,在得到最终的簇集后进行验证,并根据需要进行调整;
预先设定计数阈值,若对其中一种异常轨迹的计数超过了所述计数阈值,或者在预设的时间范围内超过了预设的计数阈值,则发出对应的预警信息以告知对应的业务类型的默认轨迹发生变化或者出现了新的默认轨迹。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
定期获取预设历史时间范围内所有的用户操作轨迹;
对所有的用户操作轨迹采用聚类算法得到至少一个簇;
分别对每个簇中所包含的用户操作轨迹进行分析,得到所述轨迹模型。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
对每种异常轨迹进行计数;
若所述计数超过预设计数阈值,则发出预警信息。
4.一种用于基于web数据的用户操作轨迹分析装置,其特征在于,包括:
流量采集单元,用于实时获取用户操作轨迹,所述用户操作轨迹至少包括业务类型;
轨迹分析单元,用于根据预先通过聚类算法获取的轨迹模型,将所述用户操作轨迹与具有相同业务类型的所有默认轨迹进行比对;其中,所述轨迹模型包括与每种业务类型对应的至少一条默认轨迹;
交叉识别单元,用于若所述用户操作轨迹与默认轨迹不同,则将所述用户操作轨迹标记为异常轨迹;
采用聚类算法,根据不同维度条件,将所有的用户操作轨迹进行归类汇聚,根据对聚类算法的具体设置得到一个簇集,其中至少包括一个簇;
所述聚类算法为K-Means聚类算法,K-Means算法通过预先设定的K值及每个类别的初始质心对相似的用户操作轨迹进行划分,并通过划分后的均值迭代优化获得最优的聚类结果;
使用误差平方和作为聚类的目标函数,两次运行K均值产生的两个不同的簇集,误差平方和越小相似度越高,从而在误差平方和最小时的簇集为最终的结果;其中所述K值根据业务类型的数量来进行设定,在得到最终的簇集后进行验证,并根据需要进行调整;
预先设定计数阈值,若对其中一种异常轨迹的计数超过了所述计数阈值,或者在预设的时间范围内超过了预设的计数阈值,则发出对应的预警信息以告知对应的业务类型的默认轨迹发生变化或者出现了新的默认轨迹。
5.根据权利要求4所述的装置,其特征在于,所述装置还包括:
数据仓库单元,用于定期获取预设历史时间范围内所有的用户操作轨迹;
关联计算单元,用于对所有的用户操作轨迹采用聚类算法得到至少一个簇;
建模单元,用于分别对每个簇中所包含的用户操作轨迹进行分析,得到所述轨迹模型。
6.根据权利要求4所述的装置,其特征在于,所述装置还包括:
量化单元,用于对每种异常轨迹进行计数;
所述量化单元,还用于若所述计数超过预设计数阈值,则发出预警信息。
7.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至3任一项所述用户操作轨迹分析方法的步骤。
8.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1至3任一项所述用户操作轨迹分析方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国移动通信集团浙江有限公司;中国移动通信集团有限公司,未经中国移动通信集团浙江有限公司;中国移动通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811453609.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:驱动装置、照相装置以及电子设备
- 下一篇:一种电磁线圈
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置