[发明专利]一种基于情感分析的检测网络水军方法有效
申请号: | 201710559558.7 | 申请日: | 2017-07-11 |
公开(公告)号: | CN109241518B | 公开(公告)日: | 2021-01-22 |
发明(设计)人: | 陈彤;相迎宵;刘京京;王盈地;白肖璇;彭紫荆;孙志巍;关哲林;牛温佳;刘吉强 | 申请(专利权)人: | 北京交通大学 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F16/958;G06K9/62 |
代理公司: | 北京市商泰律师事务所 11255 | 代理人: | 黄晓军 |
地址: | 100044 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种基于情感分析的检测网络水军方法,其特征在于,包括:获取网页评论数据,将所述评论数据进行数据预处理,将预处理过的数据分为测试数据集和训练数据集,将两种数据集构建成语料库,并进行手动情感分类,将两种数据集进行文本预处理后,运用设定分类器对训练数据集进行数据处理,生成分类模型,利用测试数据集测试分类模型精确度,然后运用已生成精确度高的分类模型对待检测数据进行自动情感分类;最后进行数据规则匹配,检测出网络水军。本发明集成了数据爬取、数据预处理、词袋模型建立、分类器构建以及规则设置五个功能模块,实现对网络水军进行快速检测的算法,在提高算法检测速度的同时,保证对用户评论的情感分类精确度。 | ||
搜索关键词: | 一种 基于 情感 分析 检测 网络 水军 方法 | ||
【主权项】:
1.一种基于情感分析的检测网络水军方法,其特征在于,包括:S1:获取网页评论数据,将所述评论数据进行数据预处理,得到精简数据;S2:将所述精简数据分为第一数据集、第二数据集,将所述第一数据集和所述第二数据集进行手动数据情感分析处理后构建成语料库;S3:将所述第一数据集和第二数据集进行文本预处理,得到第一文本特征向量和第二文本特征向量;S4:读取所述语料库,运用设定分类器对所述第一文本特征向量进行数据处理,生成分类模型,利用所述第二文本特征向量测试所述分类模型精确度;S5:所述分类模型精确度测试合格后,运用所述分类模型对待检测数据进行数据处理,得出具有情感类别标签的数据;S6:运用设定规则对所述具有情感类别标签的数据进行分析匹配,检测出网络水军。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京交通大学,未经北京交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710559558.7/,转载请声明来源钻瓜专利网。