[发明专利]一种结合用户结构相似度进行微博情感分析的方法有效
申请号: | 201910041751.0 | 申请日: | 2019-01-16 |
公开(公告)号: | CN109508380B | 公开(公告)日: | 2021-07-16 |
发明(设计)人: | 杨静;邹晓梅;张健沛;韩宏宇;张薇 | 申请(专利权)人: | 哈尔滨工程大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 150001 黑龙江省哈尔滨市南岗区*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 结合 用户 结构 相似 进行 情感 分析 方法 | ||
本发明涉及一种结合用户结构相似度进行微博情感分析的方法。方法包括以下步骤:(1)根据微博用户之间的关注关系,计算用户之间的结构相似度,建立用户相似度矩阵,即情绪感染性矩阵,同时建立情绪感染性模型;(2)根据社会学中的情感一致性理论,建立微博之间的情感一致性关系矩阵,同时建立情绪一致性模型;(3)使用前两步生成的模型,建立根据微博间关系矩阵形成的微博情感分析模型;(4)在前三步的基础上,加入使用微博文本内容的情感分析模型;(5)对第四步建立的模型进行优化,求解出微博情感分析器。本发明的优势在于针对微博数据的特点,提出了结合微博数据间关系的方法进行情感分析,有效的提高了微博情感分析的准确率。
技术领域
本发明属于大数据分析领域,具体涉及一种结合用户结构相似度进行微博情感分析的方法。
背景技术
随着互联网技术的发展,大量新型的社交平台如Twitter、新浪微博等随之出现。它们吸引着大量用户,用户在这些网站上发表大量包含着他们各种各样的观点的推文、微博。而分析用户观点在各个领域都有重要作用和意义,例如可以通过分析用户观点来对股市进行预测、提高推荐系统的准确率、调查用户对于产品的反馈、帮助政府部门进行舆情监督等。以上所述的分析用户观点的过程就称为情感分析。虽然之前也有一些相关工作,但目前公认的情感分析比较系统的研究工作大部分都是基于Pang在2002的研究。而相对来说,Turney同样在2002提出的无监督学习的方法虽然在实现上更加简单,但是由于单词之间的情感相似度难以准确的计算和种子词的难以确定,继续在无监督学习方向的研究并不是很多的,但是利用SO-PMI算法计算文本情感倾向性的思想却被很多研究者所继承了。
Pang于2002年开始通过基于监督学习方法对电影评论文本进行情感倾向性分类,Turney也于2002年通过基于无监督学习对文本情感倾向性分类进行研究。Pang基于文本的N元语法gram和词类POS等特征分别使用朴素贝叶斯Naive Bayes,最大熵Maximum Entropy和支持向量机SVM将文本情感倾向性分为正向和负向两类,将文本的情感进行二元划分的做法也一直沿用至今。同时他们在实验中使用电影评论数据集目前已成为广泛使用的情感分析的测试集。Turney在基于点互信息PMI计算文本中抽取的关键词和种子词的相似度来对文本的情感倾向性进行判别,即所谓的SO-PMI算法。
情感分类方法可以分为两类:基于词典的分析方法和基于机器学习的方法。基于词典的分析方法利用情感词典如SentiWordNet,SenticNet等对句子中的词进行情感标记,整个文档的情感是对其句子的词的情感的综合。基于词典的情感分析方法是无监督的,并不需要事先标记的数据集,这种方法的缺点是过分依赖情感词典,且可移植性差,与分析领域有很大关联。基于机器学习的情感分析方法是将情感分析视为文本分类。这种方法从已经标记的文本中提取特征,然后对未知文本进行分类。这类方法通常需要大量的带标记的训练集,分类精度和训练集的规模有很大关系。
但由于这些新兴的社交网络的内容是由用户生成的,其表达方式各异,生成的句子简短,含有大量的噪音来干扰传统的情感分析方法。传统的单纯基于选择不同的文本特征的方法在这种新的情境下并不适用。这些方法假设各个文本之间是相互独立的,在社交网站上,这个假设并不成立,文本之间存在着各样的关系。
发明内容
本发明的发明目的在于结合新涌现的社交网络的特征,提供一种不同于基于文本之间相互独立模型的新型的微博情感分析方法。
本发明为一种结合用户结构相似度进行微博情感分析的方法,具体包括如下步骤:
(1)根据微博用户之间的关注关系,计算用户之间的结构相似度,建立用户相似度矩阵,即情绪感染性矩阵,同时建立情绪感染性模型;
(2)根据社会学中的情感一致性理论,建立微博之间的情感一致性关系矩阵,同时建立情绪一致性模型;
(3)使用前两步生成的模型,建立根据微博间关系矩阵形成的微博情感分析模型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工程大学,未经哈尔滨工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910041751.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种样本数据处理方法及装置
- 下一篇:知识图谱的处理方法及装置