[发明专利]一种基于深度信念网络的单分类微博谣言检测模型有效
申请号: | 201811276813.8 | 申请日: | 2018-10-30 |
公开(公告)号: | CN109597944B | 公开(公告)日: | 2022-04-01 |
发明(设计)人: | 梁刚;许春;杨进;杨文太;陈俊仁;高玉君;王印玺;黄华雪 | 申请(专利权)人: | 四川大学 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06K9/62 |
代理公司: | 成都其高专利代理事务所(特殊普通合伙) 51244 | 代理人: | 贾波 |
地址: | 610065 四川*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 信念 网络 分类 谣言 检测 模型 | ||
1.一种基于深度信念网络的单分类微博谣言检测模型,进行谣言的甄别,其特征在于,包括下述具体步骤:
1)进行关键用户节点选择,在微博中选择有影响力和有代表性的用户,包括以下具体步骤:
1.1)通过新浪微博中的“发现”-“找人”频道收集到微博网络中共计49个领域有影响力的用户,并将获得的用户信息产生一个新的集合;
1.2)从新的集合中随机选择部分用户,作为中心点,形成中心点用户;
1.3)从步骤1.1)中产生的用户集合中除去步骤1.2)中用到的中心点用户,依次计算剩余用户与选出的中心点用户的距离,并将每个剩余用户到中心点用户点距离最短的中心作为自己所属的类中心;
1.4)将步骤1.3)得到的中心用户数据应用到整个用户集合数据集合,计算每一个用户和中心点的距离,选择距离最小的中心点类别作为该用户的类别;
1.5)重复步骤1.3),步骤1.4),直到类中心不在改变;
1.6)将中心点用户作为关键用户节点存储到数据库;
2)数据的爬取及数据预处理;
3)采用深度信念网络将步骤2)预处理后的数据进行特征提取与降维,在进行特征提取与降维时,采用CD-1算法实现,包括下述具体步骤:
3.1)设定模型参数初值:w=0,a=0,b=0;
3.2)从训练数据集合D选择一个变量x,利用公式p(hj=1|v)=sigmod(bj+∑iwijvi)计算p(hcount=1|D),从p(hcount=1|D)获得隐藏变量hcount;
3.3)对于同样的训练数据集合D,利用公式p(vi=1|h)=sigmod(ai+∑jwijhj)计算p(vcount=1h),根据计算结果重构训练数据集合D';
3.4)根据步骤3.2)得到的h,对于隐藏层利用公式p(hj=1|v)=sigmod(bj+∑iwijvi)计算p(hcount'=1|D');
3.5)更新模型的参数,有:
3.6)重复步骤3.2)-步骤3.5),直到训练数据集合D中全部变量都被遍历;
4)采用SVDD算法,根据收集的正常数据特征构建一个包容所有的训练样本的超球体,通过判断待检测的微博信息是否在超球体内来进行谣言的识别,包括以下具体步骤:
4.1)对于训练数据集合D={v1,v2,...,vm1},利用公式r2=(x·x)-2∑iai(x·xi)+∑i,jaiaj(xi.xj)计算构造的超级球面的极小半径;
4.2)对于待检测的微博特征向量,利用公式f(x)=I[(x·x)-2∑iai(x·xi)+∑i,jaiaj(xi.xj)≤R2]计算向量与球心之间的距离,并根据公式f(x)=I[(x·x)-2∑iai(x·xi)+∑i,jaiaj(xi·xj)≤R2]中的指示函数的返回值判断待检测的微博是否为谣言。
2.根据权利要求1所述的一种基于深度信念网络的单分类微博谣言检测模型,其特征在于:在进行关键用户节点选择时,采用基于类别与K-medoids算法对用户的相关性进行筛选关键用户节点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川大学,未经四川大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811276813.8/1.html,转载请声明来源钻瓜专利网。