[发明专利]一种基于秩最小化的多标签图像标注结果融合方法有效
申请号: | 201310375976.2 | 申请日: | 2013-08-26 |
公开(公告)号: | CN103440651A | 公开(公告)日: | 2013-12-11 |
发明(设计)人: | 郭平;姚垚;辛欣 | 申请(专利权)人: | 北京理工大学 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100081 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 最小化 标签 图像 标注 结果 融合 方法 | ||
1.一种基于秩最小化的多标签图像标注结果的融合方法,其特征在于,包括以下步骤:
1)抽取训练集图像的多种特征表示,训练集中的每幅图像都带有事先给定的语义标注词;
2)在不同的特征表示下,分别训练各自的监督学习图像标注模型;
3)对于一幅新的没有语义标注词的图像,用同样的方法抽取该图像的多种特征表示,使用这些特征表示分别输入到对应的监督学习图像标注模型来预测新图像的多标签标注结果;
4)利用秩最小化优化算法将多个模型输出的多标签结果融合:对于不同特征表示下模型预测的结果向量,先把每一个结果向量转换为一个反对称的秩为2的关系矩阵,然后用这些关系矩阵建模一个秩最小化优化问题,解这个优化问题得到一个融合的关系矩阵,再由融合的关系矩阵构造融合的结果向量,最终由融合的结果向量得到融合的标注结果。
2.根据权利要求1所述的一种基于秩最小化的多标签图像标注结果的融合方法,其特征在于,抽取训练集图像的多种特征表示的步骤为:
1)图像分块:使用滑动窗口的策略,按照给定步长,将图像分成相互重叠的小块;
2)分别计算每一个小块内图像的特征向量,整幅图像的特征表示即由这些图像块的特征向量组成。
3.根据权利要求2所述的一种基于秩最小化的多标签图像标注结果的融合方法,其特征在于,所述特征向量是RGB颜色直方图或HSV颜色直方图或LAB颜色直方图或OPPONET颜色直方图或rg颜色直方图或Gabor纹理特征或Haar纹理特征或局部二元模式纹理特征或词包模型表示的SIFT形状特征。
4.根据权利要求1或2或3所述的一种基于秩最小化的多标签图像标注结果的融合方法,其特征在于,在不同特征表示下分别训练各自的监督学习图像标注模型的步骤为:
1)对每一幅训练图像,利用高斯混合模型对图像层条件概率密度建模,然后使用期望最大化算法计算模型参数得到该图像的条件概率密度;
2)对每一个语义标注词,找出训练图像集合中含有该标注词的所有图像,以这些图像在图像层的条件概率密度为基础,利用高斯混合模型对语义层条件 概率密度建模,然后使用层次期望最大化算法计算模型参数得到该语义标注词的条件概率密度。
5.根据权利要求4所述的一种基于秩最小化的多标签图像标注结果的融合方法,其特征在于,对一幅新的没有语义标注词的图像,用同样地方法抽取该图像的多种特征表示,使用这些特征分别输入到对应的监督学习图像标注模型来预测其多标签标注结果,其步骤为:
1)使用与训练图像同样的特征抽取技术计算新输入图像的多种特征表示;
2)使用每一种特征表示对应的监督学习图像标注模型预测输入图像的语义标注词并得到一个结果向量。
6.根据权利要求5所述的一种对多个监督学习图像标注模型的多标签结果的融合方法,其特征在于,利用秩最小化优化算法将不同特征表示下的多个模型输出的多标签结果融合的步骤为:
1)将各个结果向量分别转换为反对称的秩为2的关系矩阵的表示形式,这些关系矩阵都分别等于融合的关系矩阵加上一个对应误差矩阵;
2)在1)的约束下,通过最小化融合的关系矩阵的奇异值之和使得融合的关系矩阵的秩逐渐减小到2,通过最小化所有误差矩阵之和使得融合的关系矩阵能充分正确地结合各个模型的预测结果;
3)使用非精确的增广拉格朗日乘子法迭代解出融合的关系矩阵的最优解,迭代过程中使用奇异值截取的方式使得融合的关系矩阵的秩逐渐收敛到2;
4)使用融合的关系矩阵反向计算出的融合的结果向量,根据融合的结果向量最终确定输入图像的语义标注词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310375976.2/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序