[发明专利]基于用户评论文本的上下文情感分类方法及分类系统有效
申请号: | 201510203118.9 | 申请日: | 2015-04-27 |
公开(公告)号: | CN104794212B | 公开(公告)日: | 2018-04-10 |
发明(设计)人: | 徐华 | 申请(专利权)人: | 清华大学;清华大学无锡应用技术研究院 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙)11201 | 代理人: | 张大威 |
地址: | 100084 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于用户评论文本的上下文情感分类方法及分类系统,其中,方法包括以下步骤获取多条用户评论文本;对多条用户评论文本进行分词;对分词后的多条用户评论文本进行训练,以得到候选特征集;从候选特征集中根据上下文结构特征提取有效特征,以得到训练集;根据训练集训练分类模型,以通过分类模型对用户评论文本进行情感分类。本发明实施例的方法,通过上下文结构特征提取有效特征,实现情感分类,提高了分类准确度,更好地识别出文本中用户的情感倾向,简单方便。 | ||
搜索关键词: | 基于 用户 评论 文本 上下文 情感 分类 方法 系统 | ||
【主权项】:
一种基于用户评论文本的上下文情感分类方法,其特征在于,包括以下步骤:从互联网上获取多条用户评论文本;对所述多条用户评论文本进行分词;对分词后的多条用户评论文本进行训练,以获取每个词的特征向量得到候选特征集,获得的词向量用于提取出蕴含在词之间的语义特征;通过基于情感词典或词性的特征选择方法从所述候选特征集中根据上下文结构特征提取有效特征,以得到训练集,其中,所述上下文结构特征包括否定词特征、程度词特征和转折词特征;以及根据所述训练集训练分类模型,以通过所述分类模型对用户评论文本进行情感分类,其中,所述分类模型为SVMperf分类模型。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学;清华大学无锡应用技术研究院,未经清华大学;清华大学无锡应用技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510203118.9/,转载请声明来源钻瓜专利网。