[发明专利]一种网站行为分类方法、系统、存储介质及设备在审
申请号: | 202111014054.X | 申请日: | 2021-08-31 |
公开(公告)号: | CN113688926A | 公开(公告)日: | 2021-11-23 |
发明(设计)人: | 周劲;秦庆雪;韩士元;王琳;杜韬;纪科;张坤;赵亚欧 | 申请(专利权)人: | 济南大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F16/958 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 张庆骞 |
地址: | 250022 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 网站 行为 分类 方法 系统 存储 介质 设备 | ||
本发明属于网站行为分类领域,提供了一种网站行为分类方法、系统、存储介质及设备。其中,该方法包括获取网站行为数据集合;其中,集合中每个数据的一个属性为一个维度;对每个数据的邻居进行筛选来确定相应数据的滤波窗口;从网站行为数据集合中随机选出预设数量条数据分别作为类中心数据,计算网站行为数据集合中各个数据属于各个类中心数据的隶属度;基于每个数据的滤波窗口,再利用每个数据的每一维分别作为引导对隶属度滤波,将多维滤波后的隶属度加权求和作为最终滤波后的隶属度;利用最终滤波后的隶属度更新各个的类中心数据,进而更新各类各个维度的属性权重;迭代计算判断更新各个的类中心数据的步骤的终止情况,最后输出网站行为分类结果。
技术领域
本发明属于网站行为分类领域,尤其涉及一种网站行为分类方法、系统、存储介质及设备。
背景技术
本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
引导滤波是一种可以有效地去除噪声并且保持引导图像的边缘信息的图像滤波方法,被广泛用于图像分割、增强、去雾等方面。这一技术通常将待处理的图像作为引导图像,利用引导图像的信息对输入图像进行滤波处理,得到具有引导图像梯度信息且有效去除噪声的滤波后的图像。近年来,为了解决传统聚类算法不能很好的利用图像的空间信息而导致聚类分割结果不够准确的问题,很多学者将引导滤波方法应用到聚类过程中,提出了很多有关引导滤波的模糊聚类算法。这些方法是将要分割的图像作为引导图像,对通过模糊C均值求得的隶属度进行滤波,从而使隶属度可以包含更多的梯度信息,进而提高图像分割的准确率。
近年来,将引导滤波加入模糊聚类中用于图像分割的研究工作得到越来越多的关注。然而,当前基于引导滤波的模糊聚类算法只限于图像分割的问题,引导滤波也主要是对图像进行处理,并不适用于网站行为分析数据。而网站行为分析数据也具有空间信息,数据的潜在信息的挖掘对其更加准确的分类有着重要意义。但是,目前的带有空间信息的模糊聚类方法计算困难或者在聚类过程中容易丢失信息。
发明内容
为了解决上述背景技术中存在的技术问题,本发明提供一种网站行为分类方法、系统、存储介质及设备,其能够对网站行为进行准确分类。
为了实现上述目的,本发明采用如下技术方案:
本发明的第一个方面提供一种网站行为分类方法,其包括:
获取网站行为数据集合;其中,集合中每个数据的一个属性为一个维度;
对每个数据的邻居进行筛选来确定相应数据的滤波窗口;
从网站行为数据集合中随机选出预设数量条数据分别作为类中心数据,计算网站行为数据集合中各个数据属于各个类中心数据的隶属度;
基于每个数据的滤波窗口,再利用每个数据的每一维分别作为引导对隶属度滤波,将多维滤波后的隶属度加权求和作为最终滤波后的隶属度;
利用最终滤波后的隶属度更新各个的类中心数据,进而更新各类各个维度的属性权重;
迭代计算判断更新各个的类中心数据的步骤的终止情况,最后输出网站行为分类结果。
进一步地,所述集合中每个数据的中至少包含两个属性。
进一步地,使用K最近邻方法为网站行为数据集合中各个数据找到最近的k条数据,这k条数据就是相应数据的邻居;k为大于或等于1的正整数。
进一步地,为网站行为数据集合中各个数据找到最近的k条数据的过程为:
使用欧氏距离计算数据的距离矩阵;
为每个数据找到包括它本身的最近的k个邻居。
进一步地,确定相应数据的滤波窗口的过程为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于济南大学,未经济南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111014054.X/2.html,转载请声明来源钻瓜专利网。