[发明专利]文本图像检索方法和装置在审
申请号: | 202111095195.9 | 申请日: | 2021-09-17 |
公开(公告)号: | CN113806579A | 公开(公告)日: | 2021-12-17 |
发明(设计)人: | 王彦君;李政;郭彩丽;李忠;张宇峰;李金岭;杜忠田;王欣;丁品 | 申请(专利权)人: | 中国电信集团系统集成有限责任公司 |
主分类号: | G06F16/583 | 分类号: | G06F16/583;G06F16/58;G06F40/30;G06K9/62 |
代理公司: | 北京知汇林知识产权代理事务所(普通合伙) 11794 | 代理人: | 董涛 |
地址: | 100036 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 图像 检索 方法 装置 | ||
1.一种文本图像检索方法,其特征在于,包括:
获取训练数据集,所述训练数据集中包括若干个图像文本对,一个所述图像文本对包括一个图像数据和一个文本数据;
根据预设的算法模型提取特征向量,所述特征向量包括:所述训练数据集中所有文本数据的文本特征向量和图像数据的图像特征向量;
根据文本特征向量计算不同文本数据之间的语义相似度;
将文本数据之间的第一语义相似度作为文本数据与图像数据之间的第二语义相似度;
构建损失函数,并将第二语义相似度导入损失函数中以调整损失函数的边界;
根据损失函数对所述算法模型进行迭代训练,并将训练完成的算法模型进行保存。
2.根据权利要求1所述的方法,其特征在于,所述算法模型包括特征提取算法和特征映射算法;
所述根据预设的算法模型提取特征向量,包括:
为文本和图像分别选择特征提取算法,分别提取训练数据集中所有文本数据的特征和图像数据的特征;
通过特征映射算法,分别将文本数据的特征和图像数据的特征映射到相同的维度,获得文本特征向量和图像特征向量。
3.根据权利要求1所述的方法,其特征在于,所述文本数据之间的语义相似度为:
其中,ti和tj分别为两个不同的文本数据,fi和fj分别为ti和tj的文本特征向量。
4.根据权利要求1所述的方法,其特征在于,所述将文本数据之间的第一语义相似度作为文本数据与图像数据之间的第二语义相似度,包括:
令SS(vi,tj)=SS(ti,tj);
其中,(vi,ti)为一个图像文本对。
5.根据权利要求1所述的方法,其特征在于,所述构建损失函数,包括:
构建三元组损失函数:
其中,S(vi,ti)=S(vi,ti;W)=φ(vi)TWψ(ti)是图像特征φ(vi)和文本特征ψ(ti)之间的相似度,W是S的权重;i、j、k是样本序号;和是使用困难样本挖掘策略挖掘出的最困难负样本对;和是损失函数的边界,用于约束正样本对之间的相似度S(vi,ti)大于负样本对之间的相似度或加上一个的边界或
6.根据权利要求1所述的方法,其特征在于,所述调整损失函数的边界,包括:
将近似的文本图像语义相似度SS(vi,tj)导入损失函数中;
令三元组损失函数的边界和与近似的正样本对的语义相似度SS(vi,ti)和负样本对的语义相似度SS(vi,tj)的差值成正比。
7.根据权利要求1-6任一项所述的方法,其特征在于,所述根据损失函数对所述算法模型进行迭代训练,包括:
选择深度学习优化器,设定学习率大小和批次大小,在训练数据集上训练N次迭代;
读取验证数据集,通过验证数据集对所述算法模型进行召回率判定;
若召回率不再提升,则模型训练结束;否则继续调整损失函数的边界。
8.根据权利要求7所述的方法,其特征在于,深度学习优化器为Adam优化器,设定学习率为0.0005,批次大小为128,训练次数N=20次。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电信集团系统集成有限责任公司,未经中国电信集团系统集成有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111095195.9/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序