[发明专利]一种访客行为分类方法及系统在审
申请号: | 201810390556.4 | 申请日: | 2018-04-27 |
公开(公告)号: | CN108804520A | 公开(公告)日: | 2018-11-13 |
发明(设计)人: | 林志伟;肖龙源;蔡振华;李稀敏;刘晓葳;谭玉坤 | 申请(专利权)人: | 厦门快商通信息技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q30/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 361000 福建省厦门*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 访客行为 分类 聚类 平方和 数据标准化 标准数据 聚类算法 手动控制 业务经验 原始数据 自动确定 计算群 拐点 标准化 采集 分配 | ||
1.一种访客行为分类方法,具体方法包括,
数据标准化,对采集的原始数据进行数据标准化,得到标准化后的数据yi,标准化公式为:其中x为数据点,n为数据点的总个数,i=1,2,…,n;所述原始数据为访客行为数据,包括具体行为的次数和时间;所述行为包括访问行为;
执行k-means聚类计算,确定访客行为最大分类数k_max,分别取k=1,2,3,…,k_max,划分成k类依次对确定的标准数据进行k-means聚类,并计算群内平方和WSS,依次得到k_max个WSS数值;
确定WSS的拐点k_best;
重新按照k_best的值作为k-means的初始分类数,重新对数据进行依次k-means聚类。
2.根据权利要求1所述的访客行为分类方法,具体方法还包括,y维度判断,判断y维度是否大于设定阈值,如果否,则执行k-means聚类计算。
3.根据权利要求2所述的访客行为分类方法,具体方法还包括,如果y维度大于设定阈值,则对数据y进行降维,得到确定的标准化数据。
4.根据权利要求2所述的访客行为分类方法,采用PCA算法对数据y进行降维。
5.根据权利要求1所述的访客行为分类方法,采用PCA算法确定WSS的拐点k_best。
6.根据权利要求1到5之一所述的访客行为分类方法,所述方法还包括,重新对数据进行依次k-means聚类后,输出每个访客数据所对应的分类编号。
7.一种访客行为分类系统,其特征在于:包括,
访客行为采集模块,采集访客行为数据,包括具体行为的次数和时间;所述行为包括访问行为;
数据标准化计算模块,对采集的原始数据进行数据标准化,得到标准化后的数据yi,标准化公式为:其中x为数据点,n为数据点的总个数,i=1,2,…,n;所述原始数据为访客行为数据;
第一k-means聚类计算模块,确定访客行为最大分类数k_max,分别取k=1,2,3,…,k_max,划分成k类依次对确定的标准数据进行k-means聚类,并计算群内平方和WSS(Within-Cluster Sum of Square),依次得到k_max个WSS数值;
WSS拐点k_best确定模块,确定WSS的拐点k_best;
第二k-means聚类计算模块,重新按照k_best的值作为k-means的初始分类数,重新对数据进行依次k-means聚类。
8.根据权利要求7所述的访客行为分类系统,其特征在于:还包括y维度判断模块,判断y维度是否大于设定阈值,如果否,则执行k-means聚类第一k-means聚类计算。
9.根据权利要求8所述的访客行为分类系统,其特征在于:还包括数据y降维模块,如果y维度大于设定阈值,则对数据y进行降维,得到确定的标准化数据。
10.根据权利要求7所述的访客行为分类系统,其特征在于:还包括访客数据分类编号输出模块,重新对数据进行依次k-means聚类后,输出每个访客数据所对应的分类编号。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门快商通信息技术有限公司,未经厦门快商通信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810390556.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:电子设备
- 下一篇:一种基于知识图谱的问答方法及农业百科问答系统