[发明专利]细粒度的多模态虚假新闻检测方法在审
申请号: | 202111152971.4 | 申请日: | 2021-09-29 |
公开(公告)号: | CN113934882A | 公开(公告)日: | 2022-01-14 |
发明(设计)人: | 曹娟;亓鹏;何覃;谢添 | 申请(专利权)人: | 北京中科睿鉴科技有限公司 |
主分类号: | G06F16/583 | 分类号: | G06F16/583;G06F40/295;G06V20/62;G06V10/74;G06V10/774;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 杭州九洲专利事务所有限公司 33101 | 代理人: | 沈敏强 |
地址: | 100084 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 细粒度 多模态 虚假 新闻 检测 方法 | ||
1.一种细粒度的多模态虚假新闻检测方法,其特征在于:
获取待检测多模态新闻的新闻文本和新闻图片;
从新闻文本中提取人物类型、地点类型和事件类型的文本实体;
从新闻图片中提取图片文本,人物类型、地点类型和事件类型的视觉实体,以及新闻图片的视觉CNN特征,其中新闻图片的视觉CNN特征包括分区域从该新闻图片中提取出的视觉特征;
使用BERT模型获取人物类型、地点类型和事件类型视觉实体的视觉实体特征;
将新闻文本与图片文本拼接后输入BERT模型,获得文本特征;
利用多模态协同注意力Transformer模型融合文本特征、视觉CNN特征和视觉实体特征,获得由视觉实体和视觉CNN特征增强的文本表示、由文本增强的视觉CNN表示和由文本增强的视觉实体表示;
基于文本实体和视觉实体的特征向量计算跨模态的人物相似度、地点相似度和事件相似度;
基于视觉实体和视觉CNN特征增强的文本表示、文本增强的视觉CNN表示和文本增强的视觉实体表示,以及跨模态的人物相似度、地点相似度和事件相似度计算所述多模态新闻的多模态表示;
基于多模态新闻的多模态表示判断该多模态新闻的真实性。
2.根据权利要求1所述的细粒度的多模态虚假新闻检测方法,其特征在于,所述利用多模态协同注意力Transformer模型融合文本特征、视觉CNN特征和视觉实体特征,获得由视觉实体和视觉CNN特征增强的文本表示、由文本增强的视觉CNN表示和由文本增强的视觉实体表示,包括:
将文本特征和视觉实体特征输入文本视觉实体协同注意力Transformer模型,获得由视觉实体增强的文本表示和由文本增强的视觉实体表示;
将视觉实体增强的文本表示和视觉CNN特征输入文本视觉特征协同注意力Transformer模型,获得由视觉实体和视觉CNN特征增强的文本表示和由文本增强的视觉CNN表示。
3.根据权利要求1所述的细粒度的多模态虚假新闻检测方法,其特征在于,所述从新闻图片中提取新闻图片的视觉CNN特征,包括:
将新闻图片输入VGG19模型,将原始图片分割为m*m的区域,从VGG19模型的最后一层提取图片的视觉CNN特征,视觉CNN特征包括该新闻图片m*m个图片区域的视觉特征。
4.根据权利要求1所述的细粒度的多模态虚假新闻检测方法,其特征在于,所述从新闻图片中提取人物类型、地点类型和事件类型的视觉实体,包括:
利用名人检测模型识别图片中的名人,作为人物类型的视觉实体;
利用预训练的地标检测模型识别图片中的地标,作为地点类型的视觉实体;
通过特殊符号及服饰检测模型识别图片中的组织机构名,通过预训练的图像识别模型识别有冲击力的视觉概念及通用的目标及场景标签,作为事件类型的视觉实体。
5.根据权利要求1所述的细粒度的多模态虚假新闻检测方法,其特征在于,基于文本实体和视觉实体的特征向量计算跨模态的人物相似度,包括:
其中,为跨模态的人物相似度;t和v分别为文本实体和视觉实体的特征向量;Tp为多模态新闻中文本人物实体集合;Vp为多模态新闻中视觉人物实体集合;ρ(v)表示新闻图片包含视觉人物实体v的概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京中科睿鉴科技有限公司,未经北京中科睿鉴科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111152971.4/1.html,转载请声明来源钻瓜专利网。