[发明专利]电影评论情感分析方法及装置有效
申请号: | 201910122560.7 | 申请日: | 2019-02-19 |
公开(公告)号: | CN109684647B | 公开(公告)日: | 2020-07-24 |
发明(设计)人: | 刘美玲;尚月;韩悦 | 申请(专利权)人: | 东北林业大学 |
主分类号: | G06F40/211 | 分类号: | G06F40/211;G06F40/247;G06F40/289;G06F40/284;G06F16/35 |
代理公司: | 哈尔滨市松花江专利商标事务所 23109 | 代理人: | 刘冰 |
地址: | 150040 黑龙*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 电影评论情感分析方法及装置,属于数据分析领域,具体涉及一种评论的分析方法及装置。为了解决利用现有的情感分析方法对电影评论进行情感分析存在准确度低的问题。本发明首先对影评语料进行分词等预处理并进行句法分析;判断词是否属于影评属性特征词词典中的词,并查询判断该词的父节点的兄弟节点,获取句子中距离该词最近的节点对应的词,作为情感词;遍历W‑SVM情感词典和SO‑VEC情感词典,并判断情感词属于情感词典中的哪一类,并记录词语情感值;最后根据该词与情感词之间的否定词数量更新词语情感值;最终根据词语情感值确定影评细粒度情感。本发明适用于电影评论的情感分析。 | ||
搜索关键词: | 电影 评论 情感 分析 方法 装置 | ||
【主权项】:
1.电影评论情感分析方法,其特征在于,包括以下步骤:(1)爬取待分析的电影评论语料,并利用扩充结巴分词词典对爬取的语料进行分词,并进行去停用词预处理,得到预处理之后的语料;针对每个句子生成预处理之后的词语集合wordlist[j],所有句子的预料集合为wordlist;同时,按照分词结果对句子进行句法分析;(2)对于句子中的每一个词Wi∈wordlist[j],查询特征词词典featureDict,判断Wi是否属于影评属性特征词词典featureDict中的词;若是,跳向步骤(3);否则,另j+1;(3)基于句法分析,判断Wi的父节点是否是“NN”或“NR”或“PN”,如果是,遍历这个父节点的父节点的兄弟节点找到标记为“VA”的节点;否则,返回步骤(2);NN为常用名词,NR为固有名词,PN为代词,VA为表语形容词;(4)获取句子中距离Wi最近的“VA”的节点对应的词,作为情感词p;(5)遍历W‑SVM情感词典和SO‑VEC情感词典,若p属于褒义词情感词典,词语情感值VWi=1;若p属于贬义词情感词典,VWi=‑1;所述褒义词情感词典包括W‑SVM情感词典和SO‑VEC情感词典中的褒义词情感词典,所述贬义词情感词典包括W‑SVM情感词典和SO‑VEC情感词典中的贬义词情感词;(6)判断Wi与p之间的词mk是否属于否定词词典,并记录mk的数量λ,同时更新词语情感值VWi=VWi*(‑1)λ;最终根据词语情感值VWi确定影评细粒度情感;所述的否定词词典为否定词构成的词典。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东北林业大学,未经东北林业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910122560.7/,转载请声明来源钻瓜专利网。