[发明专利]一种高效的垃圾评论用户群组检测方法有效
申请号: | 201811177783.5 | 申请日: | 2018-10-10 |
公开(公告)号: | CN109460508B | 公开(公告)日: | 2021-10-15 |
发明(设计)人: | 张小旭;邓水光;李莹;吴健;尹建伟;吴朝晖 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/953 |
代理公司: | 杭州天勤知识产权代理有限公司 33224 | 代理人: | 王琛 |
地址: | 310013 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种高效的垃圾评论用户群组检测方法,其基于电商网站上产品的评论数据,得到候选群组(每个群组要求至少由2个人组成且至少共同评论3件产品),提取出异构网络中每个产品节点、用户节点、群组节点的基于自身的基础垃圾信息特征和基于关系的垃圾影响力特征,通过考虑每个节点自身的基础垃圾信息和其他两种类型节点对它的垃圾信息影响,得到每个节点的垃圾信息,包括群组节点的垃圾信息,将高于某个阈值的群组识别为垃圾评论用户群组。同时,本发明采用优化后的GroupRank算法,能够达到的精确率、性能更高。 | ||
搜索关键词: | 一种 高效 垃圾 评论 用户 检测 方法 | ||
【主权项】:
1.一种高效的垃圾评论用户群组检测方法,包括如下步骤:(1)对电商产品的评论数据进行预处理;(2)基于预处理后的评论数据提取群组、产品以及用户的基础特征并整合成向量形式,所述群组由至少2个用户组成且这些用户至少共同评论过3件产品;(3)提取群组、产品以及用户相互之间对应的三组关系特征并整合成矩阵形式;(4)根据基础特征和关系特征通过GroupRank算法计算出所有群组的垃圾信息分值;(5)设置合适的阈值,通过垃圾信息分值与阈值之间的比较将所有群组分类为垃圾群组和非垃圾群组。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811177783.5/,转载请声明来源钻瓜专利网。