[发明专利]一种互联网商家虚假热度检测方法及系统在审
申请号: | 202211155133.7 | 申请日: | 2022-09-22 |
公开(公告)号: | CN115564514A | 公开(公告)日: | 2023-01-03 |
发明(设计)人: | 边荟凇;王俊松 | 申请(专利权)人: | 南京信息职业技术学院 |
主分类号: | G06Q30/06 | 分类号: | G06Q30/06;G06Q30/00 |
代理公司: | 南京纵横知识产权代理有限公司 32224 | 代理人: | 董建林 |
地址: | 210023 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 互联网 商家 虚假 热度 检测 方法 系统 | ||
1.一种互联网商家虚假热度检测方法,其特征在于,包括如下步骤:
通过电子商务平台获取评价数据,并将评价数据建模成多维张量数据R;
利用改进的密集块检测方法检测多维张量数据R中的密集块;
根据密集块分析电子商务平台上商家的虚假热度。
2.根据权利要求1所述的一种互联网商家虚假热度检测方法,其特征在于,评价数据包括用户、商家和评价时间。
3.根据权利要求1所述的一种互联网商家虚假热度检测方法,其特征在于,将评价数据建模成多维张量数据R,设R为K维张量数据,则R={R1,R2,…,Ri,…,RK},其中,Ri表示张量数据R中的第i维张量数据,Ri={ai,1,ai,2,…,ai,j,…,ai,length(Ri)},ai,j表示第i个维度中第j个属性,i=1,2,…,K,j=1,2,…,length(Ri),length(Ri)表示Ri中属性的数量。
4.根据权利要求3所述的一种互联网商家虚假热度检测方法,其特征在于,利用改进的密集块检测方法检测多维张量数据R中的密集块的方法为:
(1)令D=R;
(2)在张量数据D中随机选取一个子张量,作为初始的密集块B0,初始化final_B=B0,final_metric=metric(B0,R),其中,metric(B0,R)表示密集块B0相对于张量数据R的可疑程度;
(3)基于密集块B0,利用CrossSpot方法对张量数据D进行收敛,得到收敛后的密集块B;
(4)如果收敛后的密集块B相对于张量数据R的可疑程度metric(B,R)final_metric,则final_metric=metric(B,R),final_B=B;
(5)从i=1到i=K,计算密集块B中每个维度下每个属性的计数,并根据计数对每个维度的所有属性进行降序排列,得到降序排列后的属性列表Bi={ai,1,ai,2,…,ai,j,…,ai,length(Bi)},其中,count(ai,1)≥…≥count(ai,j)≥…≥count(ai,length(Bi)),count(ai,j)表示第i个维度中第j个属性的计数,length(Bi)表示降序排列后的属性列表Bi中属性的数量;
(6)分别剪除Bi中最后一个属性ai,length(Bi),结合密集块B中除i之外的其他K-1个维度的属性得到对应的备选密集块B’(i)及其可疑程度B’_metric(i)=metric(B’(i),R);
(7)比较K个备选密集块的可疑程度,得到可疑程度最大的备选密集块,记为max_B;
(8)令D=max_B,B0=random_seed(D);
(9)判断D是否为空,如果D不为空,返回步骤(3),如果D为空,将fianl_B作为最终检测出的密集块并输出。
5.根据权利要求4所述的一种互联网商家虚假热度检测方法,其特征在于,每当步骤(9)输出一个密集块后,将该密集块从张量数据R中删除,基于更新后的张量数据R重复步骤(1)~(9),检测多个密集块。
6.根据权利要求4所述的一种互联网商家虚假热度检测方法,其特征在于,利用度量指标DTS或DGCS度量密集块的可疑程度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京信息职业技术学院,未经南京信息职业技术学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211155133.7/1.html,转载请声明来源钻瓜专利网。