[发明专利]基于情感极性影响力的微博内容可信度评估方法在审
申请号: | 202110988205.5 | 申请日: | 2021-08-26 |
公开(公告)号: | CN113742449A | 公开(公告)日: | 2021-12-03 |
发明(设计)人: | 邢玲;高建平;吴红海;姚景龙;赵康 | 申请(专利权)人: | 河南科技大学 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/35;G06F40/169;G06F40/279;G06F40/30;G06N3/04;G06N3/08 |
代理公司: | 四川鼎韬律师事务所 51332 | 代理人: | 温利平 |
地址: | 471000 河南*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 情感 极性 影响力 内容 可信度 评估 方法 | ||
1.一种基于情感极性影响力的微博内容可信度评估方法,其特征在于,包括以下步骤:
S1:获取若干可信微博和不可信微博数据,构成微博数据集,每条微博数据包括微博的原文文本和由该微博原文下的评论文本合并得到的合并评论文本,并设置该微博的标签,当该微博属于可信微博,其标签为1,否则标签为0;
S2:分别对每条微博数据的原文文本和合并评论文本进行嵌入式表示,具体方法如下:首先对文本进行预处理,包括分词、停用词过滤,将得到的词语构成向量,并将该向量归一化至预设长度L,从而得到该文本对应的词向量;然后对该词向量中的词语进行嵌入式表示,将每个词语的嵌入向量xi构成该文本对应的嵌入矩阵X,i=1,2,…,L;
S3:构建微博内容可信度评估模型,包括文本特征表示模块、情感特征表示模块、可信度评估模块,其中:
文本特征表示模块用于根据微博原文文本的嵌入矩阵提取出微博原文内容对应的文本特征并输出至可信度评估模块,文本特征表示模块包括嵌入层、BiLSTM层、卷积层和池化层,其中:
嵌入层用于对微博原文文本的嵌入矩阵进行转换处理,得到转换处理后的语句矩阵并输出至BiLSTM层,转换处理的表达式如下:
X′=WX
其中,X′表示转换处理后的语句矩阵,W表示词嵌入矩阵;
BiLSTM层用于对接收到的语句矩阵进行编码,将得到的特征矩阵H输出至卷积层;
卷积层用于接收到的特征矩阵H进行卷积操作,得到特征矩阵V并输出至池化层;
池化层对接收到的特征矩阵V进行最大池化,将得到的特征图作为文本特征O输出至可信度评估模块,K表示预设的嵌入维度;
情感特征表示模块用于根据微博合并评论文本的嵌入矩阵提取出微博评论内容的情感特征并输出至可信度评估模块,情感特征表示模块包括嵌入层和BiLSTM层,其中:
嵌入层用于对微博合并评论文本的嵌入矩阵进行转换处理,得到转换处理后的语句矩阵并输出至BiLSTM层;
BiLSTM层用于对接收到的语句矩阵进行编码,将得到的特征矩阵作为微博评论内容的情感特征S输出至可信度评估模块,
可信度评估模块用于根据微博原文内容的文本特征和微博评论内容的情感特征,得到微博的可信度;可信度评估模块包括情感极性影响力模块、特征融合模块、全连接层模块和softmax层,其中:
情感极性影响力模块用于采用注意力机制获取不同情感极性对于微博原文语义特征的影响,对情感特征S进行重构,得到重构的情感特征向量s′,情感特征重构的具体方法如下:
对文本特征O进行平均池化,得到长度为K的文本特征向量o;
对于情感特征S,将其每个行向量作为一个样本,对L个样本进行类别数为2的聚类,得到两个聚类中心,分别记为Cr,其中r=0表示负面情感,r=1表示正面情感,然后采用如下公式计算情感极性影响力qr:
其中,表示矩阵对应元素相乘,上标T表示转置;
得到情感极性影响力向量Q=(q1,q2),采用softmax函数对情感极性影响力向量Q进行处理,得到情感极性影响力分配概率分布α=softmax(Q)=(α0,α1);然后采用如下公式计算得到重构的情感特征向量s′:
s′=α0C0+α1C1
情感极性影响力模块将文本特征向量o和情感特征向量s′发送至特征融合模块;
特征融合模块用于对文本特征向量o和情感特征向量s′进行融合,得到融合特征m并发送至全连接层模块,特征融合的计算公式如下:
m=λoo+λss′
其中,λo、λs分别表示文本特征向量o和情感特征向量s′的权重;
全连接层模块包括两层级联的全连接层,用于对融合特征m进行处理,将得到的特征发送至softmax层;
softmax层用于根据接收的特征得到微博原文文本属于可信微博的概率,作为可信度进行输出;
S4:将步骤S2得到的微博中原文文本嵌入矩阵和合并评论文本嵌入矩阵作为微博可信度评估模型的输入,微博对应的标签作为微博内容可信度评估模型的期望输出,对微博内容可信度评估模型进行训练;
S5:当需要对某条微博进行可信度评估时,获取其原文文本和合并评论文本,采用步骤S2中的相同方法分别获取原文文本和合并评论文本的嵌入矩阵,然后输入微博内容可信度评估模型,得到该微博的可信度。
2.根据权利要求1所述的微博内容可信度评估方法,其特征在于,所述嵌入式表示方法采用GloVe方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河南科技大学,未经河南科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110988205.5/1.html,转载请声明来源钻瓜专利网。