[发明专利]基于协同矩阵分解的在线哈希跨模态信息检索方法有效
申请号: | 201910025025.X | 申请日: | 2019-01-11 |
公开(公告)号: | CN109766481B | 公开(公告)日: | 2021-06-08 |
发明(设计)人: | 王笛;王泉;万波;王蕾;杨鹏飞;田玉敏;赵辉 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06F16/903 | 分类号: | G06F16/903 |
代理公司: | 陕西电子工业专利中心 61205 | 代理人: | 田文英;王品华 |
地址: | 710071 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于协同矩阵分解的在线哈希跨模态信息检索方法,其步骤为:(1)生成初始训练集;(2)在线训练哈希跨模态信息检索模型;(3)判断信息检索系统实施获取新样本个数是否大于等于100;(4)计算待检索样本的哈希编码;(5)得到检索结果。本发明采用矩阵分解的思想构建信息损失函数,能够对于实时获取的无类标信息在线建立模型,并根据获取到的数据在线更新模型,在模型训练的过程中,信息检索系统只需存储前一轮的优化结果,降低了系统存储压力,提高了计算速度,具有广泛的适应性。 | ||
搜索关键词: | 基于 协同 矩阵 分解 在线 哈希跨模态 信息 检索 方法 | ||
【主权项】:
1.一种基于协同矩阵分解的在线哈希跨模态信息检索方法,其特征在于,生成文本模态信息检索图像模态信息、图像模态信息检索文本模态信息的在线哈希跨模态信息检索模型,用信息检索系统实时获取到的无类标样本信息在线更新模型,在模型更新过程中,系统只需存储前一轮的优化结果,降低了信息检索系统的存储压力,提升了计算速度,实现了在线哈希跨模态检索方法,该方法的具体步骤包括如下:(1)生成初始训练集;(1a)采集不少于100个图像样本和英文单词样本;(1b)利用信息矩阵转化方法,将采集到的样本信息转化为信息矩阵,将转化后的信息矩阵存入到信息检索系统中;(1c)将图像和英文单词一一对应生成不少于100个样本对,得到初始训练集;(2)在线训练哈希跨模态信息检索模型;(2a)信息检索系统实时获取不少于100个样本信息,组成当前数据信息矩阵X∈Rd×N,其中,X表示数据信息矩阵,∈表示属于符号,R表示实数集,d表示样本信息的维数,若样本信息为图像信息,则d表示每一张图像像素点的总数,若样本信息为英文单词,则d表示单词向量化后的向量维数,N表示实时获取到的样本总数;(2b)随机生成初始化潜在语义矩阵U∈Rd×k、投影矩阵P∈Rk×d、哈希编码矩阵V∈Rk×N共三个矩阵,其中,k表示哈希编码长度,其数值由用户从8bit,16bit,24bit,32bit,64bit,128bit的编码长度中选取一个长度;(2c)构造一个信息损失函数,该函数中包含投影矩阵、潜在语义矩阵、哈希编码矩阵的信息;(2d)分别对信息损失函数中的投影矩阵、潜在语义矩阵和哈希编码矩阵求一阶导数,并将求导得到的矩阵带入到信息损失函数中,得到更新后的信息损失函数值;(2e)判断更新后的信息损失函数值是否小于更新前的信息损失函数值,若是,则执行步骤(2f),否则,执行步骤(2d);(2f)判断更新后的信息损失函数值减去更新前的信息损失函数值的差值是否大于0.001,若是,则执行步骤(2d),否则,执行步骤(2g);(2g)将更新好的哈希编码矩阵中数值大于零的,记为1,其余记为0,得到样本的哈希编码,将其存入信息检索系统中;(3)判断信息检索系统实时获取的新样本个数是否大于等于100,若是,则执行步骤(2),否则,执行步骤(4);(4)计算待检索样本的哈希编码;(4a)利用信息矩阵转化方法,将待检索的文本样本或者图像样本转化为信息矩阵;(4b)将更新好的投影矩阵与待检索样本的信息矩阵相乘,计算出待检索样本的哈希编码;(5)得到检索结果;(5a)对待检索样本的哈希编码与信息检索系统中已有哈希编码进行异或操作,得到汉明距离;(5b)将信息检索系统中存储的样本按照汉明距离的大小从小到大进行排序,将排序后的前50个样本作为检索结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910025025.X/,转载请声明来源钻瓜专利网。
- 上一篇:一种数据查询方法和设备
- 下一篇:用于服务费用的智能型搜索系统及其方法