[发明专利]一种基于自注意力推理的跨模态图文互索方法在审
申请号: | 202210184249.7 | 申请日: | 2022-02-24 |
公开(公告)号: | CN114461821A | 公开(公告)日: | 2022-05-10 |
发明(设计)人: | 李召 | 申请(专利权)人: | 中南大学 |
主分类号: | G06F16/43 | 分类号: | G06F16/43;G06F16/432;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 410083 湖南*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于自注意力推理的跨模态图文互索方法,属于跨模态检索领域。本发明提出的自注意力推理模型主要包含三个模块:第一部分利用自上而下的预训练骨干网络提取图像显著性特征,而文本分支特征提取,则利用词嵌入+序列化模型类结构得到;第二部分设计了自注意力推理模块,考虑每个边界框对于整体语义的贡献及语义之间的粘合性,并进一步消除不相关语义带来的负面影响;第三部分设计两分支间的交互注意力模块,使得相对应的图像‑文本对拥有更大的权重,以影响后续相似度评定。实验证明,本方法较传统方法具有匹配精度更高、检索速度更快的特点。 | ||
搜索关键词: | 一种 基于 注意力 推理 跨模态 图文 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学,未经中南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202210184249.7/,转载请声明来源钻瓜专利网。
- 上一篇:一种微显示器贴合方法
- 下一篇:一种喷漆废水的处理装置和处理方法