[发明专利]一种产品垃圾评论者检测系统有效

申请号：	201410034998.7	申请日：	2014-01-24
公开（公告）号：	CN103745001A	公开（公告）日：	2014-04-23
发明（设计）人：	陈国龙;廖祥文;林秀娇;刘月;魏晶晶	申请（专利权）人：	福州大学
主分类号：	G06F17/30	分类号：	G06F17/30
代理公司：	福州元创专利商标代理有限公司 35100	代理人：	蔡学俊
地址：	350108 福建省福州市***	国省代码：	福建;35
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种产品垃圾评论检测系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及垃圾评论者识别技术领域，更具体地，涉及一种产品垃圾评论者检测系统。

背景技术

当前，有很多技术方法可用于产品垃圾评论者检测。传统的垃圾评论者检测采用检测评论者行为的方法，该方法能够准确地检测出具有特定类型的垃圾评论者，如发表重复评论的垃圾评论者。但是对于发表非重复评论的垃圾评论者，则无法检测。另一方面，现在的大部分的垃圾评论者为了避免被识别，不会写大量的重复评论。

在现有技术中，还存在着一些新式的垃圾评论者检测技术方法。新式的垃圾评论者检测方法利用评论者、评论、商店的关系检测垃圾评论者。新式的垃圾评论者检测方法迭代计算每个评论者的可信度，评论者可信度与他所发表的评论真实度有关，真实度越高其可信度就越高；真实度与商店可靠性有关，而商店可靠度和评论者可信度有关。

然而，新式垃圾评论者检测有其自身的特点，与传统垃圾评论者检测有所不同。新式的垃圾评论者检测方法典型地使用评论数据的内部关系，不仅能检测出写重复评论的垃圾评论者，而且能检测出发表非重复的垃圾评论者。

目前的垃圾评论者检测方法没有充分考虑新式垃圾评论者检测的结构特点，而且只能适用于特定类型的垃圾评论者检测。随着近年来互联网的高速发展，在利益驱使下，产品评论中已经出现了大量垃圾评论者，需要对垃圾评论者进行检测，这就对垃圾评论者检测技术提出了一个挑战：如何构建一个统一有效的产品垃圾评论者原型系统来检测出不同类型的垃圾评论者。因此，人们迫切希望有一种高效准确的垃圾评论者检测方法，该方法能够检测出不同类型的垃圾评论者。

发明内容

本发明的目的在于提供一种产品垃圾评论者检测系统，该系统检测速度快，准确度度高，通用性强。

为实现上述目的，本发明的技术方案是：一种产品垃圾评论者检测系统，包括：

预处理及数据输入模块，用于对回复数据集进行预处理，过滤无效的回复，得到新的回复数据集，然后将评论数据集、回复数据集、评论者集合、回复者集合、商店集合和产品集合输入模型计算模块；

模型计算模块，包括评论者可信度模型、评论真实度模型和商店可靠性模型，用于迭代计算评论者可信度、评论真实度和商店可靠性；以及

结果输出模块，用于输出计算得到的评论者可信度，得到最终的检测结果。

进一步的，所述预处理及数据输入模块按如下方法过滤无效的回复：

a)如果回复者在评论数据集中没有评论，则判定该回复者是不可信的回复者，删除该回复者的回复；

b)删除重复的回复，即删除同一个回复者针对同一个评论者且针对同一个产品的多次回复，只计一次回复；

c)删除评论者对自己评论的回复。

进一步的，所述评论者可信度模型为：

T(r)=21+e-Hr-1]]>