[发明专利]一种基于视觉描述语句的图像检索方法在审
申请号: | 202010998165.8 | 申请日: | 2020-09-21 |
公开(公告)号: | CN112256904A | 公开(公告)日: | 2021-01-22 |
发明(设计)人: | 聂为之;李杰思;刘安安;徐宁;张勇东 | 申请(专利权)人: | 天津大学 |
主分类号: | G06F16/58 | 分类号: | G06F16/58;G06F16/36;G06F40/30 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 李林娟 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 视觉 描述 语句 图像 检索 方法 | ||
1.一种基于视觉描述语句的图像检索方法,其特征在于,所述方法包括以下步骤:
基于图卷积深度学习网络,构建视觉知识图谱表征中节点与边的信息传递模式,实现各语义单元特征的聚合与更新;
结合注意力机制,采用多层级长短时记忆网络对图谱中聚合与更新后的各语义单元特征进行编码用于图像描述语句的生成;
在强化学习的框架下,利用CIDEr分数和图谱相似度,设计基于图像描述语句的奖惩函数,并用于“图像-图谱”过程、“图谱-语句”过程以及“图像-图谱-语句”过程的反馈调节与优化,获取图像更细粒度的视觉描述语句并进行检索,输出与查询图像对应的目标检索图像。
2.根据权利要求1所述的一种基于视觉描述语句的图像检索方法,其特征在于,所述奖惩函数具体为:
其中,ωc和ωs为可训练的融合权重;表示图像的预测描述句子,为预测描述句子的CIDEr得分;si={s1,s2,s3}为表征图谱相似度的3个相似性分数,为3个奖惩函数,其中用于“图像-图谱-语句”过程的优化,用于“图像-图谱”过程的单独优化,用于“图谱-语句”过程的单独优化。
3.根据权利要求1或2所述的一种基于视觉描述语句的图像检索方法,其特征在于,所述方法还包括:
将奖惩函数作为奖励机制,使用强化学习中策略梯度来更新网络参数,损失函数LRL(θ)关于参数θ的梯度计算式如下:
其中,为期望奖励目标函数,为上述定义的奖惩函数,为分值函数。
4.根据权利要求1或2所述的一种基于视觉描述语句的图像检索方法,其特征在于,所述方法还包括:从输入图像中检测视觉实体与视觉关系,构建图像对应的视觉知识图谱表征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010998165.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种交叉渡线处接触网装置
- 下一篇:一种业务处理方法、设备及存储介质