[发明专利]推文级社会媒体谣言检测方法有效

专利信息
申请号: 201911044320.6 申请日: 2019-10-30
公开(公告)号: CN110909125B 公开(公告)日: 2022-11-15
发明(设计)人: 刘宇威;饶洋辉 申请(专利权)人: 中山大学
主分类号: G06F16/33 分类号: G06F16/33;G06F40/117;G06F40/289;G06K9/62;G06N3/04
代理公司: 广州粤高专利商标代理有限公司 44102 代理人: 王晓玲
地址: 510275 广东*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 推文级 社会 媒体 谣言 检测 方法
【权利要求书】:

1.一种推文级社会媒体谣言检测方法,其特征在于,包括以下步骤:

S1. 收集社会媒体平台上的推文,并且以转发、评论将相关推文组成一个事件,并且按照时间戳将推文排序,然后将推文文本进行清洗;利用辟谣平台的信息给事件打上对应的标签;

S2. 不对推文进行分词,直接利用word2vec中的CBOW方法对推文中的字进行训练,得到每个字的向量表达;

S3. 使用天作为时间单位,表示出事件在每一天中的推文个数;横坐标x为天,纵坐标y为当天的推文个数,即事件在当天的热度;利用断点检测的算法,即分段线性回归将事件划分为多个生命周期,此时每个生命周期代表事件发展的趋势;

S4. 通过多头自注意力机制得到每条推文中词序列的向量表达,然后通过卷积和最大池化操作得到推文向量表达,再通过前馈神经网络以及卷积池化得到每个生命周期的向量表达;

S5. 使用多层卷积神经网络模型对全部生命周期的向量矩阵进行多层次的特征提取,从简单特征到复杂特征,然后最后通过全连接层和sigmoid函数对事件的标签进行预测;

S6. 利用训练数据集的标签信息训练好上述模型的参数,最后在测试数据集上判断每个事件是否是谣言,与真实标签进行比对验证上述模型的效果。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911044320.6/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top