[发明专利]一种基于不完整文本描述的特定行人检索方法有效
申请号: | 201510153983.7 | 申请日: | 2015-04-02 |
公开(公告)号: | CN104715071B | 公开(公告)日: | 2017-10-03 |
发明(设计)人: | 胡瑞敏;叶茫;梁超;柳东静;王正;陈军;刘俊 | 申请(专利权)人: | 武汉大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/62 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙)42222 | 代理人: | 薛玲 |
地址: | 430072 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 完整 文本 描述 特定 行人 检索 方法 | ||
1.一种基于不完整文本描述的特定行人检索方法,由两部分组成:离线处理和在线处理;其特征在于:所述的离线处理包括对图像库中的训练图片训练属性分类器和距离尺度学习;所述的在线处理首先把用户针对查询文本进行的不完整的描述转化为一个初始属性向量,然后采用线性稀疏重建的方法将初始属性向量重建成一个完整的向量最后使用基于属性的尺度学习得到的矩阵M进行距离计算;使用训练得到的属性分类器提取图像库中的测试图片属性向量,使用向量图像库中测试图片的属性向量和矩阵M,获得查询文本与图像库中的测试图片的距离,根据得到的距离进行升序排列,即可相应的对图像库中的测试图片进行排名。
2.根据权利要求1所述的基于不完整文本描述的特定行人检索方法,其特征在于:所述的离线处理,预先计算测试图片的视觉特征向量和属性向量,其中将尺度学习引入到属性向量的距离计算;具体实现包括以下子步骤:
步骤1.1:采用线性SVM来训练属性分类器,训练数据包含两部分:视觉特征向量和已标签化的属性;对于每一种属性,都会训练一个分类器,其中所有包含该属性的样本视为正样本,而其余的则视为负样本;
步骤1.2:在训练分类器的基础上,提取测试图片的属性向量;因为分类器对每个属性的输出值是从负无穷到正无穷,所以使用logistic函数将输出值变换到(0,1)区间内;所述的logistic函数为:
其中,x为分类器的原始输出,y为变换值,表明拥有该属性的可能性;
步骤1.3:基于属性的尺度学习;给定一对样本xi,xj(xi,xj∈Rd),它们之间的马氏距离定义如下:
其中,M≥0,并且是一个半正定矩阵;Rd表示实数空间;
定义马氏距离的矩阵M如下:
其中,
yij=1表示相似样本对的协方差矩阵,yij=0表示不相似样本对的协方差矩阵;矩阵M用来计算属性向量之间的距离。
3.根据权利要求1所述的基于不完整文本描述的特定行人检索方法,其特征在于:所述的在线处理,具体实现包括以下子步骤:
步骤2.1:把用户不完整的文本描述转化为一个初始属性向量t1×n,其中n是指预定义属性的个数,对于用户提供的属性,n标记为1,否则,n标记为0;
步骤2.2:对于初始属性向量t1×n,给定训练属性矩阵其中m是训练图像的个数;令W表示重建的权重向量,第i组的重建权重定义为gi={w(i,1),w(i,2),...,w(i,|gi|)},其中(i,j)表示权重向量w中第i组的第j个权重,则重建问题能用公式表示如下:
其中:为字典矩阵,包含了训练图像的属性向量;wm×1为客观的重建权重向量;λ为调整因子,用于平衡组的稀疏性;组的稀疏性将L1范式和L2范式结合在一起;定义一个对角矩阵Wi,i=exp(ti),用来衡量t初始的重建权重;
步骤2.2:使用线性稀疏重建,得到一个最优的权重矩阵W,则重建向量
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510153983.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:锗硅异质结晶体管的大信号模型方法
- 下一篇:一种搜索推荐词的处理方法和装置