[发明专利]基于元学习及深度学习的少样本社交媒体谣言检测方法有效
申请号: | 202110770088.5 | 申请日: | 2021-07-07 |
公开(公告)号: | CN113377959B | 公开(公告)日: | 2022-12-09 |
发明(设计)人: | 陆恒杨;范晨悠;杨舜;吴小俊 | 申请(专利权)人: | 江南大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/33;G06F16/335;G06F40/126;G06N20/00 |
代理公司: | 苏州市中南伟业知识产权代理事务所(普通合伙) 32257 | 代理人: | 夏苏娟 |
地址: | 214122 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 学习 深度 样本 社交 媒体 谣言 检测 方法 | ||
本发明公开了一种基于元学习及深度学习的少样本社交媒体谣言检测方法,包括:通过大样本事件的文本数据和双向GRU模型得到通用预测模型,获取少样本事件的文本数据并将少样本事件的谣言检测任务建模为二分类机器学习任务,将少样本事件的文本数据分为有标注少样本和无标注少样本,使用有标注少样本更新通用预测模型的参数得到少样本谣言预测模型,将无标注少样本输入少样本谣言预测模型得到预测结果。本发明通过元学习方法构造少样本谣言预测模型和二分类机器学习任务,对突发事件相关文本进行有效的谣言预测,从而在早期及时遏制谣言的传播。
技术领域
本发明涉及自然语言处理技术领域,具体涉及一种基于元学习及深度学习的少样本社交媒体谣言检测方法。
背景技术
现有的使用机器学习进行谣言检测的方法大都将谣言检测建模为二分类问题,将谣言检测建模为二分类问题通过预测文本样例的真实性来鉴定是否是谣言,相关研究经历了从早期的手工构建文本特征[1,2]到近期的基于深度学习的自动特征表示方法[3,4];出现了结合社交媒体的传播特性,基于社交账号间的互动、转发评论等传播信息开展谣言检测的研究[5]。
但是,这种方法并不适用于初期样本很少的情况,现有的谣言检测任务通常需要各类已知事件有充足的有标注数据用于建模和训练,并且在测试阶段需要检测的谣言也与训练所用的事件有关。就像新型冠状病毒肺炎(Corona Virus Disease 2019,COVID-19,简称“新冠肺炎”)这一类的突发新事件,在社交媒体诞生至今从未出现过,在初期可供训练的数据也极其稀少,就不能很好地进行检测。对现有谣言检测模型带来了巨大的挑战。
参考文献:
[1]Qazvinian V,Rosengren E,Radev D,et al.Rumor has it:Identifyingmisinformation in microblogs[C].Proceedings of the 2011Conference onEmpirical Methods in Natural Language Processing.2011:1589-1599.
[2]Popat K.Assessing the credibility of claims on the web[C].Proceedings of the 26th International Conference on World Wide WebCompanion.2017:735-739.
[3]Ma J,Gao W,Mitra P,et al.Detecting rumors from microblogs withrecurrent neural networks[C].25th International Joint Conference onArtificial Intelligence,IJCAI 2016.International Joint Conferences onArtificial Intelligence,2016:3818-3824.
[4]Yu F,Liu Q,Wu S,et al.A convolutional approach for misinformationidentification[C].Proceedings of the 26th International Joint Conference onArtificial Intelligence.2017:3901-3907.
[5]Shu K,Wang S,Liu H.Understanding user profiles on social media forfake news detection[C].2018 IEEE Conference on Multimedia InformationProcessing and Retrieval(MIPR).IEEE,2018:430-435.
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江南大学,未经江南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110770088.5/2.html,转载请声明来源钻瓜专利网。