[发明专利]文本图像检索方法和装置在审
申请号: | 202111095195.9 | 申请日: | 2021-09-17 |
公开(公告)号: | CN113806579A | 公开(公告)日: | 2021-12-17 |
发明(设计)人: | 王彦君;李政;郭彩丽;李忠;张宇峰;李金岭;杜忠田;王欣;丁品 | 申请(专利权)人: | 中国电信集团系统集成有限责任公司 |
主分类号: | G06F16/583 | 分类号: | G06F16/583;G06F16/58;G06F40/30;G06K9/62 |
代理公司: | 北京知汇林知识产权代理事务所(普通合伙) 11794 | 代理人: | 董涛 |
地址: | 100036 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 图像 检索 方法 装置 | ||
本申请涉及一种文本图像检索方法和装置;所述方法包括:获取训练数据集;根据预设的算法模型提取特征向量;根据文本特征向量计算不同文本数据之间的语义相似度;将文本数据之间的第一语义相似度作为文本数据与图像数据之间的第二语义相似度;构建损失函数,并将第二语义相似度导入损失函数中以调整损失函数的边界;根据损失函数对所述算法模型进行迭代训练,并将训练完成的算法模型进行保存。本申请的方案利用文本之间的语义相似度近似文本与图像之间的语义相似度,利用近似的文本图像语义相似度调整损失函数的边界,能够大幅提升排序结果的合理性,达到提升检索用户实际体验,提升多媒体数据管理效率的效果。
技术领域
本申请涉及人工智能技术领域,具体涉及一种文本图像检索方法和装置。
背景技术
文本图像检索是指给定一个查询文本,在图像数据库中检索与查询文本语义相关的图像,在很多领域有重大应用,例如在大型图像、视频类网站有巨大的应用需求,用户输入查询文本,通过文本图像检索技术,实现对查询文本相关的图像或视频的检索,从而达到多媒体数据的快速索引,提升多媒体数据管理效率,提升用户使用体验的效果。
相关技术中,在文本图像检索系统的训练过程中,三元组损失函数平等地对待所有的负样本。然而,在实际情况中,锚点与不同的负样本之间的语义相似度并不相同,平等地对待所有的负样本会造成视觉语义空间的不连贯,从而造成检索的排序结果不合理,影响用户体验。
发明内容
为至少在一定程度上克服相关技术中存在的问题,本申请提供一种文本图像检索方法和装置。
根据本申请实施例的第一方面,提供一种文本图像检索方法,包括:
获取训练数据集,所述训练数据集中包括若干个图像文本对,一个所述图像文本对包括一个图像数据和一个文本数据;
根据预设的算法模型提取特征向量,所述特征向量包括:所述训练数据集中所有文本数据的文本特征向量和图像数据的图像特征向量;
根据文本特征向量计算不同文本数据之间的语义相似度;
将文本数据之间的第一语义相似度作为文本数据与图像数据之间的第二语义相似度;
构建损失函数,并将第二语义相似度导入损失函数中以调整损失函数的边界;
根据损失函数对所述算法模型进行迭代训练,并将训练完成的算法模型进行保存。
进一步地,所述算法模型包括特征提取算法和特征映射算法;
所述根据预设的算法模型提取特征向量,包括:
为文本和图像分别选择特征提取算法,分别提取训练数据集中所有文本数据的特征和图像数据的特征;
通过特征映射算法,分别将文本数据的特征和图像数据的特征映射到相同的维度,获得文本特征向量和图像特征向量。
进一步地,所述文本数据之间的语义相似度为:
其中,ti和tj分别为两个不同的文本数据,fi和fj分别为ti和tj的文本特征向量。
进一步地,所述将文本数据之间的第一语义相似度作为文本数据与图像数据之间的第二语义相似度,包括:
令SS(vi,tj)=SS(ti,tj);
其中,(vi,ti)为一个图像文本对。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电信集团系统集成有限责任公司,未经中国电信集团系统集成有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111095195.9/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序