[发明专利]一种自动进行描述图像的方法无效
申请号: | 201110302621.1 | 申请日: | 2011-10-08 |
公开(公告)号: | CN102360431A | 公开(公告)日: | 2012-02-22 |
发明(设计)人: | 汲业;陈燕;李桃迎;牟向伟;屈莉莉 | 申请(专利权)人: | 大连海事大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 大连东方专利代理有限责任公司 21212 | 代理人: | 李洪福 |
地址: | 116026 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种自动进行描述图像的方法,包括以下步骤:对图像进行三级分割;提取图像纹理特征;提取图像颜色特征;多关键字描述。本发明完成每个子图像的纹理和颜色的特征提取后,将每个子图像的纹理和颜色的特征合并,每个子图像都用一个合并后的单一特征向量代表,将每个特征向量输入至预先训练好的支持向量机,即可将图像库转化为对图像描述的文本库,并用文本搜索的方式,为该文本库建立索引;当用户提交查询请求时,检索文本索引,找到与用户查询相符合的图像描述,从而返回与这些描述对应的图像;由此可见,本发明使图像搜索转化为文本搜索,避免了基于内容图像检索时,逐一计算图像高维度特征向量,因此提高了搜索的效率和准确性。 | ||
搜索关键词: | 一种 自动 进行 描述 图像 方法 | ||
【主权项】:
1.一种自动进行描述图像的方法,其特征在于:包括以下步骤:A、对图像进行三级分割将图像按照以下方式分割为三级:一级图像:即原图,不用分割;二级子图像:将图像分成2*2的四个子块,另外将图像中间部分分割出来,共五块子图像;三级子图像:将图像分成4*4的十六个子块;由此,一幅图像共分割成二十二个子图像,针对每一幅子图像分别进行B、C步骤;B、提取图像纹理特征对于一幅图像,利用公式(1)计算每个像素点的灰度值:I = 0.229 0.587 0.114 R G B - - - ( 1 ) ]]> 对于每个像素点在某邻域内的灰度变化,考虑该像素点的3*3邻域,它包括9个像素点,其中Ii(i=0,1,…,8)表示图像在该像素点处的灰度,I0所在位置为中心点,用矩阵表示为I 1 I 2 I 3 I 4 I 0 I 5 I 6 I 7 I 8 ]]> 因此像素点I0的灰度变化值为:
从公式(2)容易看出,T看作八位二进制数,它的取值为T∈{0,1,...,255};计算图像所有像素点的T值,T(i,j)表示像素点I0(i,j)处的值,hk(k=0,1,...,255)表示T值为k的像素点数量与总像素的比值,则:h k = Σ i = 0 m - 1 Σ j = 0 n - 1 f ( i , j , k ) m * n - - - ( 3 ) ]]> 其中n和m分别为图像的高度和宽度,f(i,j,k)表示为:f ( i , j , k ) = 1 if T ( i , j ) = k 0 otherwise - - - ( 4 ) ]]> 由此得图像的纹理特征向量空间模型{h0,h1,...,h255};C、提取图像颜色特征对于图像的每个像素点,由RGB变换到R’G’B’:R ′ = max ( R , G , B ) - R max ( R , G , B ) - min ( R , G , B ) G ′ = max ( R , G , B ) - G max ( R , G , B ) - min ( R , G , B ) B ′ = max ( R , G , B ) - B max ( R , G , B ) - min ( R , G , B ) - - - ( 5 ) ]]> 再由R’G’B’变换到HSV:
其中,H∈[0,360],S∈[0,1],V∈[0,1];式中,R、G和B分别代表RGB颜色空间中的红色、绿色和蓝色;HSV颜色空间的色调H是由颜色名称来辨别的,如红、橙、绿,它用角度0°~360°度量;亮度V是颜色的明暗程度,通常用百分比度量,从黑0%到白100%;色度或饱和度S指颜色的深浅,例如同样是红色,也会因浓度不同而分为深红和浅红,它也用百分比来度量,从0%到完全饱和的100%;将H、S、V三个分量按照颜色感知进行非等间隔的量化,从对颜色模型的大量分析,把色调H空间分成8份,饱和度S和亮度V空间分别分成3份,并根据色彩的不同范围进行量化,量化后的色调、饱和度和亮度值分别为H’、S’和V’;H ′ = 0 if H ∈ ( 316,360 ] U [ 0,20 ] 1 if H ∈ ( 20,40 ] 2 if H ∈ ( 40,75 ] 3 if H ∈ ( 75,155 ] 4 if H ∈ ( 155,190 ] 5 if H ∈ ( 190,270 ] 6 if H ∈ ( 270,295 ] 7 if H ∈ ( 296,315 ] S ′ = 0 if S ∈ ( 0,0.2 ] 1 if S ∈ ( 0.2,0.7 ] 2 if S ∈ ( 0.7,1 ] - - - ( 7 ) ]]>V ′ = 0 if V ∈ ( 0,0.2 ] 1 if V ∈ ( 0.2,0.7 ] 2 if V ∈ ( 0.7,1 ] ]]> 按照以上的量化级,把三个颜色分量合成为一维特征矢量:l=H′QSQV+S′QV+V′ (8)其中,Qs和Qv分别是分量S和V的量化级数,由式(7)可知,S和V都被量化为0、1或2三级,因此S和V的量化级数为Qs’=3,Qv=3;因此公式(8)式表示为:L=9H′+3S′+V′ (9)将H’S’V’三个分量转化为一维矢量;根据公式(7)和(9)可得L∈{0,1,...,71} (10)计算图像所有像素点的L值,L(i,j)表示像素点(i,j)处的值,lk(k=0,1,...,255)表示L值为k的像素点数量与总像素的比值,则:l k = Σ i = 0 m - 1 Σ j = 0 n - 1 g ( i , j , k ) m * n - - - ( 11 ) ]]> 其中n和m分别为图像的高度和宽度,g(i,j,k)表示为:g ( i , j , k ) = 1 ifL ( i , j ) = k 0 otherwise - - - ( 12 ) ]]> 由此得图像的纹理特征向量空间模型{l0,l1,...,l71};D、多关键字描述完成每个子图像的纹理和颜色的特征后,将每个子图像的纹理和颜色的特征合并,每个子图像都用一个合并后的单一特征向量代表,将每个特征向量输入至预先训练好的支持向量机,该支持向量机使用径向基核函数,由2582张分属动物、植物、室内装饰、建筑、车、人、天空和太空八类的图片训练而成;设R(i,j,k)作为分类的判定结果,即第j级分割的第k张子图像imagek,属于第i类Categoryi,R ( i , j , k ) = 1 if image k ∈ Category i 0 otherwise - - - ( 13 ) ]]> 由此,计算整幅图像属于第i类的量化值ri,考虑到整体与局部对图像内容理解的不同贡献,采用相应的加权策略,r i = w 1 * R ( i , 1,1 ) + w 2 * Σ k = 1 5 R ( i , 2 , k ) + w 3 * Σ k = 1 16 R ( i , 3 , k ) - - - ( 14 ) ]]> 其中,权重系数w1为1,w2为0.2,w3为0.0625,显然ri在[1,3]之间,当ri大于0.3即可将该类别作为关键字赋予图像。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连海事大学,未经大连海事大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201110302621.1/,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序