[发明专利]一种使用社交上下文特征的深度微博情感分析方法在审
申请号: | 201910446241.1 | 申请日: | 2019-05-27 |
公开(公告)号: | CN110188200A | 公开(公告)日: | 2019-08-30 |
发明(设计)人: | 杨静;邹晓梅;韩宏宇;张薇 | 申请(专利权)人: | 哈尔滨工程大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/33;G06F16/9536;G06F17/27;G06Q50/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 150001 黑龙江省哈尔滨市南岗区*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 微博 情感分析 上下文特征 上下文信息 预处理 文本信息 自然语言处理 采集 分类模型 记忆网络 连续分布 实数向量 文本情感 文本特征 用户信息 文本 学习 发布 分析 | ||
1.一种使用社交上下文特征的深度微博情感分析方法,其特征在于,包括以下步骤:
步骤1:采集微博数据并对其进行预处理,具体包括采集和预处理微博文本信息和发布微博的用户即社交上下文信息;
步骤2:使用一种深度学习方法对微博社交上下文信息进行表示,将每个微博表示成为连续分布的实数向量;
步骤3:建立一个基于长短期记忆网络的深度学习分类模型,结合微博文本特征和社交上下文特征对微博进行情感分析。
2.根据权利要求1所述的一种使用社交上下文特征的深度微博情感分析方法,其特征在于,步骤2中对社交上下文关系图G(V,E)进行表示具体包括以下步骤:
步骤2.1:对社交上下文网络G(V,E)中的局部信息进行表示:
其中vi和vj是节点νi和νj的向量表示,wij表示节点νi和νj之间的权重;
步骤2.2:对社交上下文中的全局信息进行表示:
其中当νi表示网络节点时,vi是其向量表示;当νi表示上下文时,vi′是此时的向量表示;
步骤2.3:为了解决低效率的目标优化问题,引入负采样,使用异步随机梯度算法ASGD来优化,具体公式为:
3.根据权利要求1所述的一种使用社交上下文特征的深度微博情感分析方法,其特征在于,在步骤3中,使用社交上下文表示作为特征对微博进行情感分析具体包括以下步骤:
步骤3.1:为了更好地利用微博社交上下文信息,通过连接社交上下文向量v与词语向量ω来作为编码器的输入,以这种方式,隐藏层输出表示(h1,h2,...,hN)具有来自微博社交上下文的信息;
步骤3.2:计算基于长短期记忆网络的编码器的隐藏层输出:
ft=sigmoid(Wf·[ht-1,ωt,vi]+bf)
it=sigmoid(Wi·[ht-1,ωt,vi]+bi)
ot=sigmoid(Wo·[ht-1,ωt,vi]+bo)
Ct=ft⊙Ct-1+it⊙tanh(Wc·[ht-1,ωt]+bc)
ht=ot⊙tanh(Ct)
ft,it,ot分别是遗忘门,输入门和输出门,Wf,Wi,是权重矩阵,bf,bI,是每个门的偏差,ωt表示当前词语的向量表示,Ct是细胞状态,ht是隐藏的输出,⊙表示点乘,输入序列由最后的隐藏输出hN表示,dv是社交上下文嵌入的维度,dh表示隐藏层输出的维度,d为ωt的维度;
步骤3.3:计算注意力机制产生注意力权重向量α和加权隐藏表示r:
α=softmax(wTM)
r=HαT
其中,H是由前面步骤产生的由隐含层输出向量[h1,...,hN]组成的矩阵,N是输入微博的长度,和是权重矩阵,α∈RN是由注意力权重组成的向量,表示带权重的微博表示,dv是社交上下文嵌入的维度,dh表示隐藏层输出的维度,是向量vi的N次连接,eN是元素为N个1的列向量,表示线性转换vi的重复次数和句子中的单词数目相同。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工程大学,未经哈尔滨工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910446241.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于智能语音交互的文本分类方法
- 下一篇:一种信息匹配方法及设备