[发明专利]一种产品垃圾评论者检测系统有效
申请号: | 201410034998.7 | 申请日: | 2014-01-24 |
公开(公告)号: | CN103745001A | 公开(公告)日: | 2014-04-23 |
发明(设计)人: | 陈国龙;廖祥文;林秀娇;刘月;魏晶晶 | 申请(专利权)人: | 福州大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 福州元创专利商标代理有限公司 35100 | 代理人: | 蔡学俊 |
地址: | 350108 福建省福州市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 产品 垃圾 评论 检测 系统 | ||
技术领域
本发明涉及垃圾评论者识别技术领域,更具体地,涉及一种产品垃圾评论者检测系统。
背景技术
当前,有很多技术方法可用于产品垃圾评论者检测。传统的垃圾评论者检测采用检测评论者行为的方法,该方法能够准确地检测出具有特定类型的垃圾评论者,如发表重复评论的垃圾评论者。但是对于发表非重复评论的垃圾评论者,则无法检测。另一方面,现在的大部分的垃圾评论者为了避免被识别,不会写大量的重复评论。
在现有技术中,还存在着一些新式的垃圾评论者检测技术方法。新式的垃圾评论者检测方法利用评论者、评论、商店的关系检测垃圾评论者。新式的垃圾评论者检测方法迭代计算每个评论者的可信度,评论者可信度与他所发表的评论真实度有关,真实度越高其可信度就越高;真实度与商店可靠性有关,而商店可靠度和评论者可信度有关。
然而,新式垃圾评论者检测有其自身的特点,与传统垃圾评论者检测有所不同。新式的垃圾评论者检测方法典型地使用评论数据的内部关系,不仅能检测出写重复评论的垃圾评论者,而且能检测出发表非重复的垃圾评论者。
目前的垃圾评论者检测方法没有充分考虑新式垃圾评论者检测的结构特点,而且只能适用于特定类型的垃圾评论者检测。随着近年来互联网的高速发展,在利益驱使下,产品评论中已经出现了大量垃圾评论者,需要对垃圾评论者进行检测,这就对垃圾评论者检测技术提出了一个挑战:如何构建一个统一有效的产品垃圾评论者原型系统来检测出不同类型的垃圾评论者。因此,人们迫切希望有一种高效准确的垃圾评论者检测方法,该方法能够检测出不同类型的垃圾评论者。
发明内容
本发明的目的在于提供一种产品垃圾评论者检测系统,该系统检测速度快,准确度度高,通用性强。
为实现上述目的,本发明的技术方案是:一种产品垃圾评论者检测系统,包括:
预处理及数据输入模块,用于对回复数据集进行预处理,过滤无效的回复,得到新的回复数据集,然后将评论数据集、回复数据集、评论者集合、回复者集合、商店集合和产品集合输入模型计算模块;
模型计算模块,包括评论者可信度模型、评论真实度模型和商店可靠性模型,用于迭代计算评论者可信度、评论真实度和商店可靠性;以及
结果输出模块,用于输出计算得到的评论者可信度,得到最终的检测结果。
进一步的,所述预处理及数据输入模块按如下方法过滤无效的回复:
a)如果回复者在评论数据集中没有评论,则判定该回复者是不可信的回复者,删除该回复者的回复;
b)删除重复的回复,即删除同一个回复者针对同一个评论者且针对同一个产品的多次回复,只计一次回复;
c)删除评论者对自己评论的回复。
进一步的,所述评论者可信度模型为:
其中,T(r)为评论者r的评论者可信度,若T(r)>0,表示评论者r为可信评论者;Hr为评论真实度总和,即评论真实度总和等于评论者r发表的所有评论的评论真实度之和,nr表示评论者r发表的所有评论的总数,表示评论者r发表的第i条评论的评论真实度;
所述评论真实度模型,即评论真实度的计算方法为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410034998.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于UG的膨胀水箱注塑模具的建模方法
- 下一篇:目标用户对象的确定方法