[发明专利]基于均值偏移和K均值聚类技术的图像对象提取方法无效
申请号: | 201110196454.7 | 申请日: | 2011-07-14 |
公开(公告)号: | CN102222234A | 公开(公告)日: | 2011-10-19 |
发明(设计)人: | 陈国庆;高瞻 | 申请(专利权)人: | 苏州两江科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 南京天翼专利代理有限责任公司 32112 | 代理人: | 陈建和 |
地址: | 215123 江苏省苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 均值 偏移 技术 图像 对象 提取 方法 | ||
技术领域
本发明涉及利用图像语义处理图像的方法。
背景技术
随着信息时代的飞速发展,基于内容的图像检索技术(CBIR)的研究成果已经转化为应用技术,而且日益增长的应用需求反过来推动其研究向更高层次发展。CBIR的基本思路是从图像中提取底层的视觉特征——颜色,纹理,形状等,然后基于这些特征将用户查询的图像与数据库中的图像进行相似度的衡量,其中图像的相似性判断建立在视觉特征的相似性上。
然而计算机自动提取的图像视觉特性与人所理解的图像内容存在很大的不同。人们判断图像的相似性并非建立在图像的颜色、形状等特性上,而是主要根据图像的内容含义来判断图像是否符合自己的需要。因此传统的CBIR(基于内容的图像检索)系统的检索结果往往不尽如人意。这就需要一些高层次的概念,这些概念包含了人对图像所描述的对象、事件以及所表达的感情等内容的理解,这就是图像所具有的语义特征,即图像的高层语义知识。当这些高层语义知识被提取出来后,才能给包括图像检索在内的一系列应用提供更加令人满意的结果。
现有的检索领域,与图像检索领域相对应的文本检索领域已经发展发展得相当成熟,而对图像的语义的提取,便是将图像信息转化为与语义相关的文本信息,从而将文本到图像的检索转化为文本到文本的检索,能够大大地提高图像检索的准确率。
图像语义的提取,其前提是提取图像中的对象。即将图像中各个具有特定特征的区域划分并提取出来的过程,现有的图像对象提取方法大致分为三类:基于区域的方法,基于网格的方法,基于轮廓的方法。基于区域的方法适用于大规模颜色相近的区域,而对具有复杂内部细节的对象无法有效识别。基于网格的方法适用于具有规则形状的对象,而对其他形状的对象无法有效识别。本发明的基本思路是基于区域分割的图像对象提取算法。
均值偏移(Mean Shift)算法是一种特征空间聚类算法,它的一个突出优点是不须人为地设置过多的参数,从而得到较为客观的图像分割结果。均值偏移算法的实质对图像进行平滑处理,消除图像对象内部的细节,从而得到图像的对象信息。
K均值聚类(K-Means)算法是另一种广泛使用的聚类分析方法。K均值聚类算法用于图像分割具有直观、快速、易于实现的特点。然而K均值聚类算法的问题是需要确定聚类数目,并且初始聚类中心的选择对分类结果具有较大的影响。同时,K均值聚类仅仅使用了图像的颜色信息而没有利用空间信息,因而图像中的细节信息会对聚类的结果产生较大的影响,从而使得K均值聚类往往无法得到需要的结果。
发明内容
本发明目的是:以基于区域的方法为基础,将均值偏移和K均值聚类算法相结合,结合二者的优点,并规避了二者的缺点。从而得到拥有较好结果的图像对象提取结果,亦即提高识别的准确度。
本发明的技术方案是:基于均值偏移和K均值聚类技术的图像对象提取方法, 使用均值偏移进行图像平滑:
均值偏移算法是一种不用直接计算梯度找到模式点的算法,在图像平滑过程中,就是要找到不同色彩的聚类点; 图像中的每一个像素经过色彩空间转换表达了一个像素的空间信息和色彩信息,其中,空间位置和色彩均相近的像素,在五维色彩空间中也相近; 因而,在五维空间中进行聚类,得到的结果重新映射到图像中,即可得到达到所需要的效果。
对于任何需要处理的图像对象,1)先应用meanshift算法进行图像平滑消除细节信息,分别用xi和zi(i=1, …, n)表示原始和平滑后的图像像素点,利用meanshift算法对图像进行平滑处理;对于每一个像素点:
1-1)初始化j=1,且使yj+1=xi,像素点的空间;
1-2)在以yj为中心的超球体中计算实现窗口中心的偏移,直到满足收敛条件;
这里的超球体是指经过色彩空间的转化可以在5维特征空间中获得的很多点, 每个点对应图像中的一个像素, 表达了该像素所有的信息,亦即空间位置和色彩信息;
1-3)给zi赋值,将收敛的色彩赋给当前像素zi=(xi,yconv);
这里是均值偏移算法的固定步骤,yconv是坐标点,就是当前像素Zi的坐标。
2)k均值聚类
在进行过meanshift平滑操作后,图像的细节部分将被忽略,从而将均值偏移的结果按照其颜色信息进行进一步聚类; 在这一步骤中,要求聚类过程具有较高的效率并且能够满足一定的精度要求; 运用k均值聚类算法对图像进行分割;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州两江科技有限公司,未经苏州两江科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110196454.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种酒蒸馏装置
- 下一篇:一种不锈钢厚板防划伤折弯模