[发明专利]一种基于图像区域内聚测度的目标发现方法有效
申请号: | 201610212736.4 | 申请日: | 2016-04-07 |
公开(公告)号: | CN105868789B | 公开(公告)日: | 2019-04-26 |
发明(设计)人: | 王菡子;郭冠军;赵万磊;严严;沈春华 | 申请(专利权)人: | 厦门大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06T7/13 |
代理公司: | 厦门南强之路专利事务所(普通合伙) 35200 | 代理人: | 马应森 |
地址: | 361005 *** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于图像区域内聚测度的目标发现方法,涉及计算机视觉技术。提供可快速给出少量的目标建议窗口,使得目标建议窗口内尽可能包含目标的一种基于图像区域内聚测度的目标发现方法。同时解决目标检测和显著性检测问题。提出的图像区域内聚测度的方法还被应用于显著性检测,显著性检测也被作为计算机视觉任务的一项基本任务并广泛被应用于其他计算机视觉任务。 | ||
搜索关键词: | 一种 基于 图像 区域内 测度 目标 发现 方法 | ||
【主权项】:
1.一种基于图像区域内聚测度的目标发现方法,其特征在于包括以下步骤:A.给定高为h,宽为w的彩色图像上每一个像素pi(x,y),其中i为像素下标,x和y分别为像素的横坐标和纵坐标,该像素pi(x,y)在RGB颜色空间中的坐标为:pi=<ri,gi,bi>,其中r,g,b分别表示红绿蓝三颜色分量的值;基于包含pi的一个固定尺寸大小的平滑窗口Ωk其中k=x×w+y表示窗口下标,窗口大小通常为3×3或者5×5,pi的局部归一化向量定义为:
其中μk为窗口Ωk内像素的均值,σk为窗口Ωk内像素的方差,τ为一个很小的常数以防止除0,运算符/在公式一表示为点除;H(pi)赋予每个像素点一个局部的线性表述;基于公式一,窗口Ωk内任意两个像素的局部归一化向量的内积定义为:H(pi)T·H(pj)=(pi‑μk)T(Σk+τE)‑1(pj‑μk), (公式二)其中Σk为窗口Ωk内像素的协方差,E为单位矩阵,T表示矩阵转置操作,公式二表示窗口内任意两个像素之间的相似度;B.对于高为h,宽为w的彩色图像中任意两个像素之间的相似度可以表述成一个相似度矩阵:
其中C为一个常数,用于区分窗口Ωk内相似度为0的区域和窗口Ωk之外的区域;相似矩阵A是一个N×N的矩阵,其中N=w*h;矩阵D是一个对角矩阵,其每一个元素
通过奇异值分解,公式二,即公式三分子部分,可以分解成:H(pi)T·H(pj)=ω·(U(pi‑μk)T(pj‑μk)), (公式四)其中
是权向量ω的一个元素;
表示协方差矩阵∑k的第z个特征值;公式四等式右边表示像素pi和pj在以U的列向量为坐标轴构成坐标系的内积;另外,权重ω可以使得该内积对于光照的变化鲁棒;比如当同一颜色值受光照影响时,亮度值会发生变化;此时若直接计算量像素的像素值,则会发生误测;然而在某一颜色分量z的亮度方差比较大的小窗口内,对应协方差矩阵的特征值
也比较大,因此除以该特征值可以平衡相似度值受光照的影响;C.计算步骤B中的相似矩阵A的特征向量,该过程写成形式化表达如下:Aν=λν (公式五)其中ν表示特征向量,λ表示特征值;总体上每个特征向量ν代表了一个聚类结果,对应的特征值表示聚类结果的内聚测度值;每一个主成分都代表了一个图像中的潜在目标或者目标部件;D.把步骤C中的每个特征向量转换成二维图像格式,然后把值归一到[0,255]内,该过程定义如下:
其中
y=mod(k,w)其中νk表示相似矩阵A的第k个特征向量,min(ν)表示取特征向量ν里的最小值,max(ν)表示取特征向量ν里的最大值,mod(k,w)表示k对w取余数,二维格式的V(x,y)被称为对象图,每一个特征向量对应了一个对象图;因此,每个对象图里也包含了一个图像中的潜在目标或者目标部件;E.把步骤D中的对象图应用于显著性检测,显著性检测的目的是分割出图像中潜在的显著性目标,用阈值的方法来分割对象图里的显著性目标,其可以通过以下公式计算:
其中Tc代表给定的阈值,V*(x,y)代表阈值化结果,由于一个对象图只代表了图像中的一个或者部分显著性目标,为了尽可能多的找到全部显著性目标,多个对象图的组合也被提出,该过程定义如下:
其中mh代表对象图中最外围像素的均值,Vs表示组合对象图;公式七中的阈值计算方法也可以被用于公式八获得的组合对象图Vs以分割显著性目标;F.把步骤D中的对象图应用于目标建议窗口的生成;坎尼边缘算子被应用在每一个对象图上以获取对象的边缘,所以联通边缘的外界矩形都是一个潜在的目标建议窗口;对多个目标图获取的潜在目标建议窗口做一次筛选,对于两两潜在目标窗口重叠率大于0.9的窗口去除一个;最终剩下的潜在目标窗口为最终得到的目标建议窗口。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门大学,未经厦门大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610212736.4/,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序