[发明专利]一种基于写作风格的多任务谣言检测方法、装置及设备在审

专利信息
申请号: 202210032486.1 申请日: 2022-01-12
公开(公告)号: CN114491025A 公开(公告)日: 2022-05-13
发明(设计)人: 万书振;唐斌;董方敏;王梦园;杨广浩 申请(专利权)人: 三峡大学
主分类号: G06F16/35 分类号: G06F16/35;G06F40/211;G06F40/284;G06N3/04;G06N3/08
代理公司: 北京路浩知识产权代理有限公司 11002 代理人: 郑朝然
地址: 443002 *** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 写作 风格 任务 谣言 检测 方法 装置 设备
【说明书】:

发明提供一种基于写作风格的多任务谣言检测方法、装置及设备,该方法包括:获取待检测文本,并确定对应的内容特征以及写作风格特征;在多任务检测模型中,将内容特征输入至基于内容的谣言检测任务模块,得到谣言检测结果;将写作风格特征输入至基于写作风格的谣言检测任务模块,得到谣言检测结果;其中,在训练过程中,基于内容的谣言检测任务模块和基于写作风格的谣言检测任务模块通过共享层进行信息交互。本发明采用基于内容和写作风格相结合的多任务谣言检测方法,用以解决现有多任务谣言检测方法两个任务数据结果差异较大以及未能充分利用数据本身数据,导致模型预测性能差的缺陷,提升了模型的谣言检测性能。

技术领域

本发明涉及自然语言处理技术领域,尤其涉及一种基于写作风格的多任务谣言检测方法、装置及设备。

背景技术

基于写作风格的多任务谣言检测方法的主要技术是基于深度学习的多任务学习技术,其主要目的是借助源推文或微博以及相关评论的写作风格特征或内容特征来判断是否为谣言。

为了缓解数据量不足对深度学习模型的影响,MTL模型(MTL,Multi-TaskLearning,即多任务学习模型)被设计了出来,它可以帮助用户重用现有数据进行学习并降低人工标注数据的成本。因为MTL模型利用来自不同任务的数据,可以学到更健壮、更通用和更强大的多任务模型,从而更好地实现任务之间的知识共享,提高模型性能以及降低过拟合风险,所以MTL的模型的表现往往要优于单任务模型。在MTL的启发下,出现了基于多任务的谣言检测方法,这些多任务谣言检测方法往往是将立场检测任务和谣言检测任务组合在一起形成一个MTL模型,因为那些被证实为谣言的信息在对其的评论中往往会比真实的信息包含更多的质疑或否定内容。

现有的多任务谣言检测方法,其组成MTL模型的两个任务均是立场检测任务和谣言检测任务。但是,由于两个任务之间的关联性不是很强,且两个任务所使用的数据集差异较大,因此,虽然能共享一部分信息,但其未能够充分利用数据中的有效信息,因此导致模型对谣言检测的性能低。

发明内容

本发明提供一种基于写作风格的多任务谣言检测方法、装置及设备,用以解决现有技术中无法最大程度地利用数据集中的有效信息,导致模型对谣言检测的性能低的缺陷,实现克服了现有多任务谣言检测方法两个任务关联性不强,未能充分共享信息,同时,未能充分利用数据,导致模型预测性能差的缺陷,提升了模型的谣言检测性能。

本发明提供一种基于写作风格的多任务谣言检测方法,包括:

获取待检测文本,并确定所述待检测文本对应的内容特征以及写作风格特征;

在多任务检测模型中,将所述内容特征输入至基于内容的谣言检测任务模块,得到所述基于内容的谣言检测任务模块输出的谣言检测结果;

将所述写作风格特征输入至基于写作风格的谣言检测任务模块,得到所述基于写作风格的谣言检测任务模块输出的谣言检测结果;

其中,所述多任务检测模型包括基于内容的谣言检测任务模块和基于写作风格的谣言检测任务模块;

其中,在训练过程中,所述基于内容的谣言检测任务模块和所述基于写作风格的谣言检测任务模块通过共享层进行信息交互,在同时训练所述基于内容的谣言检测任务模块与所述基于写作风格的谣言检测任务模块时基于相同的文本数据集进行训练。

根据本发明提供的一种基于写作风格的多任务谣言检测方法,所述将所述内容特征输入至基于内容的谣言检测任务模块,得到所述基于内容的谣言检测任务模块输出的谣言检测结果的步骤包括:

将所述内容特征输入至所述共享层中,得到所述共享层输出的包含共享信息的第一中间向量;

将所述中间向量和所述内容特征拼接后输入至基于内容的谣言检测任务模块中的内容层,得到所述内容层输出包含共享信息和任务独有信息的第二中间向量;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三峡大学,未经三峡大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210032486.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top