[发明专利]一种结合用户结构相似度进行微博情感分析的方法有效
申请号: | 201910041751.0 | 申请日: | 2019-01-16 |
公开(公告)号: | CN109508380B | 公开(公告)日: | 2021-07-16 |
发明(设计)人: | 杨静;邹晓梅;张健沛;韩宏宇;张薇 | 申请(专利权)人: | 哈尔滨工程大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 150001 黑龙江省哈尔滨市南岗区*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 结合 用户 结构 相似 进行 情感 分析 方法 | ||
1.一种结合用户结构相似度进行微博情感分析的方法,具体包括如下步骤:
(1)根据微博用户之间的关注关系,计算用户之间的结构相似度,建立用户相似度矩阵,即情绪感染性矩阵,同时建立情绪感染性模型;
(2)根据社会学中的情感一致性理论,建立微博之间的情感一致性关系矩阵,同时建立情绪一致性模型;
(3)使用前两步生成的模型,建立根据微博间关系矩阵形成的微博情感分析模型;
(4)在前三步的基础上,加入使用微博文本内容的情感分析模型;
(5)对第四步建立的模型进行优化,求解出微博情感分析器;
所述的步骤(1)中建立用户相似度矩阵具体包括如下步骤:
(1.1)对于两个用户ui和uj,其结构相似度计算公式为:
其中表示二者共同的好友数量, 表示的是用户ui的邻居,即与其有直接关注关系的用户, 表示二者好友的并集;
(1.2)建立用户结构相似度矩阵S,其第i行第j列表示的是用户ui和uj之间的结构相似度,即Sij=Sim(ui,uj);
(1.3)根据用户结构相似度矩阵和情绪感染性理论,建立情绪感染性矩阵Aec:
Aec=UT×S×U;
其中U为用户微博矩阵,其第i行第j列表示的是用户ui发布了微博dj;
(1.4)根据用户之间越相似,其表达的情感越有可能相同,建立以下模型:
其中Lec=Dec-Aec,Dec是对角阵,Y∈Rn×c为每个微博对应的情感标签矩阵,n为微博数量,c为情感种类数目;为矩阵Y的第i行,为矩阵Y的第k列;X∈Rn×m为微博特征矩阵,W∈Rm×c为分类器,m表示特征数目;
所述的步骤(2)中建立情绪一致性模型具体包括如下步骤:
(2.1)根据情感一致性理论,建立情感一致性矩阵Asc,其中Asc=UT×U;
(2.2)根据同一用户发布的微博其情感更趋于一致,建立以下模型:
其中Lsc=Dsc-Asc,Dsc是对角阵,
所述的步骤(3)中微博关系情感分析模型具体包括如下步骤:
(3.1)合并步骤(1)和步骤(2)的模型,生成如下模型:
其中,α1和α2分别表示情感一致性和情绪感染性在模型中所占的比例;
(3.2)对(3.1)中的公式进行优化:
(3.3)令A=α1Ascij+α2Aecij,(3.2)的公式可化为:
其中L=D-A,D是对角阵,
2.根据权利要求1所述的一种结合用户结构相似度进行微博情感分析的方法,其特征在于所述的步骤(4)中微博关系情感分析模型具体包括如下步骤:
(4.1)结合微博的文本特征,更新步骤(3.3)的模型,即:
(4.2)对(4.1)中的模型进行正则化处理,加上正则化项||W||1;此时,待求解模型为:
其中α和β为二者对应的权重。
3.根据权利要求1所述的一种结合用户结构相似度进行微博情感分析的方法,其特征在于所述的步骤(5)具体包括如下步骤:
(5.1)将目标函数f(W;X,Y)改写为:
其中,L(W;X,Y)是可微部分,R(W)是不可微部分;
(5.2)将步骤(5.1)看作有限制的凸优化问题,其可微部分可以用近似函数来表示:
其中λt是第t次迭代的步长,L(W;X,Y)的在W处的梯度为:
因此原来的优化问题变为:
(5.3)计算第t+1次的W:
其中,
(5.4)重复计算W直到W收敛或者循环次数超过设定值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工程大学,未经哈尔滨工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910041751.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种样本数据处理方法及装置
- 下一篇:知识图谱的处理方法及装置