[发明专利]一种基于用户特征的退火注意力谣言鉴别方法及装置有效
申请号: | 202110389173.7 | 申请日: | 2021-04-12 |
公开(公告)号: | CN113204641B | 公开(公告)日: | 2022-09-02 |
发明(设计)人: | 王丽娜;骆正武;王文琦;叶傲霜;柯剑鹏 | 申请(专利权)人: | 武汉大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/38;G06K9/62;G06N3/00;G06N3/04;G06N3/08 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 王琪 |
地址: | 430072 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 用户 特征 退火 注意力 谣言 鉴别方法 装置 | ||
1.一种基于用户特征的退火注意力谣言鉴别方法,其特征在于,包括如下步骤:
步骤1,数据预处理;
所述步骤1具体包括;
步骤1.1,分类文件,所获取的数据集由谣言数据集和事实数据集二类组成,按照标签将相应数据文件写入两个文件夹;
步骤1.2,读取数据集,将参与事件传播用户的特征使用归一化数值进行表示,得到特征向量,并按照参与时间与源信息发布时间差值由小到大顺序排列,存储为时间序列;
步骤2,基于退火注意力机制的特征间注意力权重学习和时序注意力权重学习;
所述步骤2具体包括;
步骤2.1,读取步骤1中生成的时间序列T=...,(xl,tl),...,其中xl表示第l位用户的特征向量,tl表示其参与时间与源信息发布时间差值;
步骤2.2,根据获取的时间序列T=...,(xl,tl),...生成特征矩阵其中n为模型设定的序列长度,对于长度大于n的序列截断长于n的部分,长度小于n的序列填充零向量至长度为n;
步骤2.3,基于多层感知机的特征间注意力权重学习,得到步骤2.2中特征矩阵后,按照式1所示计算特征间注意力权重矩阵w1:
w1=tanh(XW1+b1) (式1)
式1中W1为可训练权重矩阵,b1为偏置矩阵,tanh为双曲正切函数;
步骤2.4,基于参数化退火函数的时序注意力权重学习,得到步骤2.2中特征矩阵后,按照式2所示使用参数化退火函数计算时序注意力权重矩阵w2:
其中,i和j分别表示矩阵元素的行号、列号,式2中Energy(xij)为参数化退火函数中的能量函数,其如式3所示:
式3中w'为可训练权重矩阵,b'为偏置矩阵,β为模型设定的固定偏置,ReLU为线性修正单元;
式2中Temperature(xij)为参数化退火函数中的温度函数,其如式4所示:
采用指数降温策略,其中T0为初始温度,α为降温率;
步骤3,用于利用特征间注意力权重与时序注意力权重信息增强原始特征矩阵,获得注意力增强特征矩阵,然后基于多层感知机,结合注意力增强特征矩阵,获得高级表示向量;
步骤4,以高级表示向量表征事件的传播模式,使用全连接神经网络进行分类鉴别。
2.根据权利要求1所述的一种基于用户特征的退火注意力谣言鉴别方法,其特征在于:所述步骤3具体包括;
步骤3.1,利用特征间注意力和时序注意力信息增强原始特征矩阵,获得注意力增强特征矩阵Xa,计算过程如式5所示:
Xa=X+γ·w1⊙w2⊙X (式5)
式5中γ为模型设定的折衷系数,⊙为矩阵点乘操作;
步骤3.2,基于多层感知机的高级表示向量提取,获得高级表示向量H,其计算过程如式6所示:
H=flatten(ReLU(XaW3+b3)) (式6)
式6中W3为可训练权重矩阵,b3为偏置矩阵,flatten为扁平化操作。
3.根据权利要求2所述的一种基于用户特征的退火注意力谣言鉴别方法,其特征在于:所述步骤4具体包括;
步骤4.1,基于全连接神经网络的分类;在获得步骤3中表征时间信息的高级表示向量H后,使用全连接神经网络与softmax函数处理高级表示向量,计算获得分类结果;
步骤4.2,使用开源数据集训练,根据分类结果优化可训练参数,学习得到最优化模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110389173.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种适用于智能用电数据聚合的方法及系统
- 下一篇:乙醇胺生产牛磺酸的循环方法