[发明专利]一种基于情感分析的检测网络水军方法有效
申请号: | 201710559558.7 | 申请日: | 2017-07-11 |
公开(公告)号: | CN109241518B | 公开(公告)日: | 2021-01-22 |
发明(设计)人: | 陈彤;相迎宵;刘京京;王盈地;白肖璇;彭紫荆;孙志巍;关哲林;牛温佳;刘吉强 | 申请(专利权)人: | 北京交通大学 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F16/958;G06K9/62 |
代理公司: | 北京市商泰律师事务所 11255 | 代理人: | 黄晓军 |
地址: | 100044 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 情感 分析 检测 网络 水军 方法 | ||
本发明提供了一种基于情感分析的检测网络水军方法,其特征在于,包括:获取网页评论数据,将所述评论数据进行数据预处理,将预处理过的数据分为测试数据集和训练数据集,将两种数据集构建成语料库,并进行手动情感分类,将两种数据集进行文本预处理后,运用设定分类器对训练数据集进行数据处理,生成分类模型,利用测试数据集测试分类模型精确度,然后运用已生成精确度高的分类模型对待检测数据进行自动情感分类;最后进行数据规则匹配,检测出网络水军。本发明集成了数据爬取、数据预处理、词袋模型建立、分类器构建以及规则设置五个功能模块,实现对网络水军进行快速检测的算法,在提高算法检测速度的同时,保证对用户评论的情感分类精确度。
技术领域
本发明涉及网络水军检测技术领域,尤其涉及一种基于情感分析的检测网络水军方法。
背景技术
近年来随着互联网技术的快速发展,人与人之间的联系变得日益密切起来。而像社交网络与电子商务,这样的网络服务平台以其高效便利性,渐渐进入人们的生活。微博、微信、推特、Facebook等社交网络的使用越来越普遍,我们可以进行网上购物,甚至利用互联网预订机票以及酒店。随着互联网技术的发展,出现了一种新兴的职业——网络水军,成为了近几年的一个研究的重点话题。在大多数的案例中,网络水军是支持其雇佣者言论或声明,对其竞争对手进行打击的,受雇群体或个人。为了避免这种不公平甚至是违法现象的出现,研究对网络水军的检测、识别技术是非常必要的。
对网络水军进行检测的方法主要有基于内容的检测方法,和基于行为的检测方法两种。针对网络水军的一些早期研究主要集中在对其内容的研究上,这是因为在早期的网络环境中,网络水军的内容有非常容易进行辨认的显著特征。基于内容的方法主要适用于对电子邮件以及网上论坛上网络水军的检测,通过内容的特征对网络水军进行检测,例如内容的词语以及主题、词语的标签以及内容的点击率等等。与此同时,网络水军的行为与一般用户是不相同的,因此基于行为特征的检测方法对网络水军进行检测,例如转发频率、回复时间频率以及活跃等级等等。
近几年,基于内容特征对网络水军进行检测方法中的一个新兴的趋势,是基于情感分析对网络水军进行检测。而这种情感是与网络水军的“隐蔽性”密不可分的。众所周知,“对抗性”是网络水军一个最基本的行为特征,“对抗性”指的是网络水军固有的,与当前存在的各种各样的网络水军检测识别技术的对抗特性,以达到在不被公众发现的前提条件下完成对舆论导向控制的目的。如果网络水军被系统检测到,这些网络水军的帐号就会被网站查封,而再次汇集到如此众多的网络水军帐号的代价是非常高昂的。因此,网络水军在采取行动的时候会非常注重“隐蔽性”,而网络水军的“情感”与“隐蔽性”也有着非常密切的联系,网络水军可以在好评如潮的产品下加入消极的评价,或者在差评如潮的产品下加入积极的评价。这种主流的网络水军行为是非常容易被发现的,但是如果网络水军在好评如潮的产品下,同样给出一个好评的评价,但是却在评论的内容中给出一个消极的评论,通过这种方式网络水军就能够在不那么容易被发现的前提条件下实现对公主舆论的控制。这种网络水军的工作方式,与主流的网络水军工作方式不同,但确实是网络水军工作的一个新趋势。这种评价打分与评论内容不一致的线索,是我们对网络水军进行检测的新线索。
通过观察淘宝网站的商品评论,发现淘宝商品信息页面可以通过用户的评分等级对评论内容进行分类,分为“好评”、“中评”、“差评”三类,每件商品的中评和差评数量都很少,好评的评论数量占绝大部分。但是通过浏览评论内容可以发现,在好评中却夹杂着很多负面的评价。这种评级与评论内容情感的不匹配是违背正常的评论模式的,我们可以认为这是一种异常评论,而这种异常评论有极大的可能不是正常的购物用户所发表的,而是水军为了诋毁对手商品而故意发表的负面评论。这些评论水军通过给予好评而隐藏在大量好评分类评论中,通过页面上所提供的评论分类的数量不易发现。而当用户在实际浏览好评分类的过程中必然会遇到很多负面评价,而这种诋毁性评论会削弱消费者的购买倾向,并且会导致用户对于产品的不信任,甚至怀疑其它好评内容的真实性。所以本发明旨在针对淘宝网站中这些评分与评论内容不匹配的隐式网络水军行为进行检测。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京交通大学,未经北京交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710559558.7/2.html,转载请声明来源钻瓜专利网。