[发明专利]一种互联网商家虚假热度检测方法及系统在审
申请号: | 202211155133.7 | 申请日: | 2022-09-22 |
公开(公告)号: | CN115564514A | 公开(公告)日: | 2023-01-03 |
发明(设计)人: | 边荟凇;王俊松 | 申请(专利权)人: | 南京信息职业技术学院 |
主分类号: | G06Q30/06 | 分类号: | G06Q30/06;G06Q30/00 |
代理公司: | 南京纵横知识产权代理有限公司 32224 | 代理人: | 董建林 |
地址: | 210023 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 互联网 商家 虚假 热度 检测 方法 系统 | ||
本发明公开了一种互联网商家虚假热度检测方法及系统,包括:通过电子商务平台获取评价数据,并将评价数据建模成多维张量数据R;利用改进的密集块检测方法检测多维张量数据R中的密集块;根据密集块分析电子商务平台上商家的虚假热度。本发明能够通过改进的密集块检测方法检测电子商务平台上的评价数据中的密集块,进而检测出互联网商家的虚假热度,检测效率高且检测结果准确可靠。
技术领域
本发明涉及一种互联网商家虚假热度检测方法及系统,属于异常数据检测技术领域。
背景技术
在互联网高速发展的今天,电子商务已经深度融入我们的日常生活,既包括在京东、淘宝等电商平台购买商品,也包括在大众点评等平台上预定餐厅、酒店等。目前这些电子商务都广泛采取评价制,即在平台上购买或预定过的消费者,可以根据自己的消费体验对对应商家给出评价,让以后的消费者有所借鉴。由于更高的好评率会增加商家的热度,吸引更多的消费者,这种“人评价商家”的关系,就会形成稀疏的二维张量数据。因此,很多商家会想办法提高自己的好评率,其中最常使用的方式是付费购买,即经常提到的“刷单”。提供刷单服务,往往是组织一批职业的刷单人,用有限的账号为大量不同的商家刷单,这就会出现一组人同时给一组商家好评的情况,由于商家购买之后,这些评价会在相对集中的时间段内产生,因此会在用户、商家和时间三个维度产生高度的一致性,而这种一致性出现在原本稀疏的张量数据中,就会产生密集块,因此,有效检测出这些密集块,就可以发现商家通过刷单产生的虚假热度。
现有的密集块检测方法较多,比如:CrossSpot检测方法、M-Zoom密集块检测方法、基于二叉树的可疑块检测方法和基于改进的密集程度度量指标的密集块检测方法,其中,如果张量中包含多个相同规模的密集块,CrossSpot检测方法和M-Zoom密集块检测方法会将几个密集块合并为一个大的密集块,导致检测结果准确率不高,基于二叉树的可疑块检测方法虽然不会合并密集块,但是其检测效率很低,基于改进的密集程度度量指标的密集块检测方法主要对密集块的可疑程度度量进行改进,如果配合CrossSpot检测方法使用,仍然会出现合并密集块的问题。综上所述,这些方法要么效率不高,难以保证检测实时性,要么准确性不够,难以满足实际检测需求,因此,需要研究更加准确、高效的密集块检测方法,从而完成互联网商家虚假热度检测。
发明内容
针对现有技术中存在的问题,本发明提出了一种互联网商家虚假热度检测方法及系统,通过改进的密集块检测方法检测电子商务平台上的评价数据中的密集块,进而检测出互联网商家的虚假热度,检测效率高且检测结果准确可靠。
为解决上述技术问题,本发明采用了如下技术手段:
第一方面,本发明提出了一种互联网商家虚假热度检测方法,包括如下步骤:
通过电子商务平台获取评价数据,并将评价数据建模成多维张量数据R;
利用改进的密集块检测方法检测多维张量数据R中的密集块;
根据密集块分析电子商务平台上商家的虚假热度。
结合第一方面,进一步的,评价数据包括用户、商家和评价时间。
结合第一方面,进一步的,将评价数据建模成多维张量数据R,设R为K维张量数据,则R={R1,R2,…,Ri,…,RK},其中,Ri表示张量数据R中的第i维张量数据,Ri={ai,1,ai,2,…,ai,j,…,ai,length(Ri)},ai,j表示第i个维度中第j个属性,i=1,2,…,K,j=1,2,…,length(Ri),length(Ri)表示Ri中属性的数量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京信息职业技术学院,未经南京信息职业技术学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211155133.7/2.html,转载请声明来源钻瓜专利网。