[发明专利]一种基于评分和中文情感分析的垃圾评论检测方法无效

专利信息
申请号: 201310002969.8 申请日: 2013-01-05
公开(公告)号: CN103064971A 公开(公告)日: 2013-04-24
发明(设计)人: 张卫丰;徐胜国;张迎周;周国强;王子元;周国富;钱小燕;许碧欢;陆柳敏 申请(专利权)人: 南京邮电大学
主分类号: G06F17/30 分类号: G06F17/30;G06F17/27
代理公司: 南京经纬专利商标代理有限公司 32200 代理人: 叶连生
地址: 210003 *** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要: 为了更好的发现垃圾评论,本发明提出一种基于评分和中文情感分析的垃圾评论检测系统,主要是针对大部分的电子商务网站提供给用户对于所购买的商品发表自己的评论,利用评分机制结合中文情感分析,来检测哪些评论是垃圾评论,进而为用户购买商品提供参考意见。本系统提出一种新的情感模式的抽取方法,改善了分类器的性能,提高了分类精度,并将中文情感分析用于垃圾评论检测中,从一个新的角度来发现垃圾评论,帮助用户做出购买决策。
搜索关键词: 一种 基于 评分 中文 情感 分析 垃圾 评论 检测 方法
【主权项】:
一种基于评分和中文情感分析的垃圾评论检测方法,其特征在于该方法所包含的步骤为:步骤1) 输入产品评论信息;步骤2) 预处理产品评论信息:步骤2.1) 生成评论信息语料库;步骤2.2) 提取语料库的第一条评论信息;步骤2.3) 判断评论信息是否存在语料库中,如果不存在,转步骤2.10),否则,转步骤2.4);步骤2.4) 判断该条评论信息是否含广告信息,如果不含,转步骤2.6),否则,转步骤2.5);步骤2.5) 删除该条评论信息,转步骤2.9);步骤2.6) 切分评论信息;步骤2.7) 获取评论信息子句;步骤2.8) 使用分词软件,分词并标注词性;步骤2.9) 提取语料库的下一条评论信息,转步骤2.3);步骤2.10) 输出产品评论信息的处理结果;步骤3) 输入情感词典;步骤4) 输入句型模式集;步骤5) 根据情感词典和句型模式集,提取对象词,情感词:步骤5.1) 输入一条评论信息;步骤5.2) 初始化该评论信息;步骤5.3) 获取评论信息的子句集合;步骤5.4) 提取第一条子句;步骤5.5) 判断子句是否存在于集合中,如果不存在,转步骤5.13),否则,转步骤5.6);步骤5.6) 获取情感词典;步骤5.7) 判断该子句是否含情感词,如果不含,转步骤5.8),否则,转步骤5.9);步骤5.8) 保存子句于客观句集合,转步骤5.12);步骤5.9) 保存子句于主观句集合;步骤5.10) 输入句型模式集;步骤5.11) 根据句型模式,提取集合:<对象词,情感词>;步骤5.12) 获取下一条子句,转步骤5.5);步骤5.13) 输出集合:<对象词,情感词>;步骤6) 分析评论信息的情感倾向:步骤6.1) 输入一条评论信息;步骤6.2) 获取评论信息的子句集合;步骤6.3) 提取第一条子句;步骤6.4) 判断子句是否存在于集合中,如果不存在,转步骤6.13),否则,转步骤6.5);步骤6.5) 获取否定词集词典;步骤6.6) 根据否定词词典,判断该句是否包含否定词,如果不包含,转步骤6.8),否则,转步骤6.7);步骤6.7) 初始化否定词的倾向值为‑1;步骤6.8) 获取副词集词典;步骤6.9) 根据副词集词典,判断该句是否包含副词,如果不包含,转步骤6.11),否则,转步骤6.10);步骤6.10) 根据副词集词典,获取副词的强度等级值;步骤6.11) 根据否定词的倾向值、副词的强度等级值、单词的倾向值,计算子句倾向值; 步骤6.12) 获取下一条子句,转步骤6.4);步骤6.13) 计算该条评论信息的倾向值; 步骤7) 根据评分和倾向值,获取结果信息:步骤7.1) 输入一条评论倾向值;步骤7.2) 获取该评论的评分;步骤7.3) 计算该产品的平均评分;步骤7.4) 如果该条评论倾向值大于零且评分小于平均评分,或者该条评论倾向值小于零且评分大于平均评分,转步骤7.5),否则,转步骤7.6);步骤7.5) 输出结果:该评论为垃圾评论,转步骤7.7);步骤7.6) 输出结果:该评论为正常评论,转步骤7.7);步骤7.7) 结束垃圾评论检测。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201310002969.8/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top