[发明专利]一种基于三角剖分的图像分类方法有效

专利信息
申请号: 201310397701.9 申请日: 2013-09-04
公开(公告)号: CN103440511B 公开(公告)日: 2016-11-02
发明(设计)人: 段立娟;张璇;苗军;马伟;杨震;王博岳 申请(专利权)人: 北京工业大学
主分类号: G06K9/66 分类号: G06K9/66
代理公司: 北京思海天达知识产权代理有限公司 11203 代理人: 张慧
地址: 100124 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明属于图像处理领域,公开了一种基于三角剖分的图像分类方法,包括:步骤一,输入训练图像;步骤二,检测训练图像集中每幅图像的所有兴趣点,得到每幅图像的点集;步骤三,对兴趣点进行三角剖分,利用角度值及其相邻边比值描述特征点的空间关系,得到图像描述子;步骤四,用图像描述子训练分类器;步骤五,输入测试图像,提取测试图像的图像描述子;步骤六,将测试图像的图像描述子输入分类器进行判别。本发明通过提取局部兴趣点并利用三角剖分技术建立图像的全局关系,得到了全局图像描述子。使用全局图像描述子训练分类器,用训练好的分类器预测图像类别。与传统方法相比,本发明图像描述子构建简单,速度快,效果好。
搜索关键词: 一种 基于 三角 图像 分类 方法
【主权项】:
一种基于三角剖分的图像分类方法,其特征在于包括以下步骤:步骤一,输入训练图像集,每类选取n张图像作为训练图像Iij,i=1,2,...,c;j=1,2,...,n;步骤二,对训练图像Iij使用SIFT即尺度不变特征转换算法提取兴趣点,记录兴趣点的坐标,得到图像Iij的兴趣点集pointSetij,i=1,2,...,c;j=1,2,...,n;方法如下:2.1使用SIFT算子检测图像Iij,提取图像Iij的所有兴趣点;2.2记录步骤一中提取的兴趣点在图像Iij中的坐标位置,形成图像Iij的兴趣点集pointSetij={p1,p2,...,pnum},其中,num是图像Iij的兴趣点数目,pk=(pkx,pky)是兴趣点的空间坐标,k=1,2,...,num;步骤三,对每幅图像的兴趣点集pointSetij使用Delaunay三角剖分技术,得到兴趣点之间的空间关系,构造一个二维矩阵作为图像描述子对图像全局进行描述;方法如下:3.1对步骤二所得图像Iij的特征点集pointSetij进行Delaunay三角剖分变换,将图像Iij中离散的特征点剖分为不均匀的三角形,构成一个三角网;3.2根据三角网中所有三角形内角的角度值θ以及其相邻的边的比值r,构造一个二维矩阵H(0)dim1×dim2作为图像描述子,并初始化为0;其中,dim1为矩阵H的行数,2<dim1<50;dim2为矩阵H的列数,2<dim2<50;3.3由步骤一中得到的三角网依次输出各个三角形的坐标,得到图像Iij的三角形坐标集triangleSetij={T1,T2,...,Ttn},其中tn是三角网中三角形的数目;每个三角形由三个坐标组成Tk={(tkx1,tky1),(tkx2,tky2),(tkx3,tky3)},k=1,2,...,tn;三角形的边长用欧式距离计算,公式如下:<mrow><msub><mi>l</mi><mn>1</mn></msub><mo>=</mo><msqrt><mrow><msup><mrow><mo>(</mo><msub><mi>t</mi><mrow><mi>k</mi><mi>x</mi><mn>3</mn></mrow></msub><mo>-</mo><msub><mi>t</mi><mrow><mi>k</mi><mi>x</mi><mn>2</mn></mrow></msub><mo>)</mo></mrow><mn>2</mn></msup><mo>+</mo><msup><mrow><mo>(</mo><msub><mi>t</mi><mrow><mi>k</mi><mi>y</mi><mn>3</mn></mrow></msub><mo>-</mo><msub><mi>t</mi><mrow><mi>k</mi><mi>y</mi><mn>2</mn></mrow></msub><mo>)</mo></mrow><mn>2</mn></msup></mrow></msqrt></mrow><mrow><msub><mi>l</mi><mn>2</mn></msub><mo>=</mo><msqrt><mrow><msup><mrow><mo>(</mo><msub><mi>t</mi><mrow><mi>k</mi><mi>x</mi><mn>3</mn></mrow></msub><mo>-</mo><msub><mi>t</mi><mrow><mi>k</mi><mi>x</mi><mn>1</mn></mrow></msub><mo>)</mo></mrow><mn>2</mn></msup><mo>+</mo><msup><mrow><mo>(</mo><msub><mi>t</mi><mrow><mi>k</mi><mi>y</mi><mn>3</mn></mrow></msub><mo>-</mo><msub><mi>t</mi><mrow><mi>k</mi><mi>y</mi><mn>1</mn></mrow></msub><mo>)</mo></mrow><mn>2</mn></msup></mrow></msqrt></mrow><mrow><msub><mi>l</mi><mn>3</mn></msub><mo>=</mo><msqrt><mrow><msup><mrow><mo>(</mo><msub><mi>t</mi><mrow><mi>k</mi><mi>x</mi><mn>2</mn></mrow></msub><mo>-</mo><msub><mi>t</mi><mrow><mi>k</mi><mi>x</mi><mn>1</mn></mrow></msub><mo>)</mo></mrow><mn>2</mn></msup><mo>+</mo><msup><mrow><mo>(</mo><msub><mi>t</mi><mrow><mi>k</mi><mi>y</mi><mn>2</mn></mrow></msub><mo>-</mo><msub><mi>t</mi><mrow><mi>k</mi><mi>y</mi><mn>1</mn></mrow></msub><mo>)</mo></mrow><mn>2</mn></msup></mrow></msqrt></mrow>由余弦定理求三角形的三个内角θ1,θ2,θ3<mrow><msub><mi>&theta;</mi><mn>1</mn></msub><mo>=</mo><mi>arccos</mi><mrow><mo>(</mo><mo>(</mo><mrow><msubsup><mi>l</mi><mn>2</mn><mn>2</mn></msubsup><mo>+</mo><msubsup><mi>l</mi><mn>3</mn><mn>2</mn></msubsup><mo>-</mo><msubsup><mi>l</mi><mn>1</mn><mn>2</mn></msubsup></mrow><mo>)</mo><mo>/</mo><mo>(</mo><mrow><mn>2</mn><mo>&CenterDot;</mo><msub><mi>l</mi><mn>2</mn></msub><mo>&CenterDot;</mo><msub><mi>l</mi><mn>3</mn></msub></mrow><mo>)</mo><mo>)</mo></mrow></mrow><mrow><msub><mi>&theta;</mi><mn>2</mn></msub><mo>=</mo><mi>arccos</mi><mrow><mo>(</mo><mo>(</mo><mrow><msubsup><mi>l</mi><mn>1</mn><mn>2</mn></msubsup><mo>+</mo><msubsup><mi>l</mi><mn>3</mn><mn>2</mn></msubsup><mo>-</mo><msubsup><mi>l</mi><mn>2</mn><mn>2</mn></msubsup></mrow><mo>)</mo><mo>/</mo><mo>(</mo><mrow><mn>2</mn><mo>&CenterDot;</mo><msub><mi>l</mi><mn>1</mn></msub><mo>&CenterDot;</mo><msub><mi>l</mi><mn>3</mn></msub></mrow><mo>)</mo><mo>)</mo></mrow></mrow><mrow><msub><mi>&theta;</mi><mn>3</mn></msub><mo>=</mo><mi>arccos</mi><mrow><mo>(</mo><mo>(</mo><mrow><msubsup><mi>l</mi><mn>1</mn><mn>2</mn></msubsup><mo>+</mo><msubsup><mi>l</mi><mn>2</mn><mn>2</mn></msubsup><mo>-</mo><msubsup><mi>l</mi><mn>3</mn><mn>2</mn></msubsup></mrow><mo>)</mo><mo>/</mo><mo>(</mo><mrow><mn>2</mn><mo>&CenterDot;</mo><msub><mi>l</mi><mn>1</mn></msub><mo>&CenterDot;</mo><msub><mi>l</mi><mn>2</mn></msub></mrow><mo>)</mo><mo>)</mo></mrow></mrow>边比值为θ角两个夹边中长边与短边的比值,即:<mrow><msub><mi>r</mi><mn>1</mn></msub><mo>=</mo><mfenced open = "{" close = ""><mtable><mtr><mtd><mrow><msub><mi>l</mi><mn>3</mn></msub><mo>/</mo><msub><mi>l</mi><mn>2</mn></msub><mo>,</mo><msub><mi>l</mi><mn>3</mn></msub><mo>&GreaterEqual;</mo><msub><mi>l</mi><mn>2</mn></msub></mrow></mtd></mtr><mtr><mtd><mrow><msub><mi>l</mi><mn>2</mn></msub><mo>/</mo><msub><mi>l</mi><mn>3</mn></msub><mo>,</mo><msub><mi>l</mi><mn>2</mn></msub><mo>&gt;</mo><msub><mi>l</mi><mn>3</mn></msub></mrow></mtd></mtr></mtable></mfenced></mrow><mrow><msub><mi>r</mi><mn>2</mn></msub><mo>=</mo><mfenced open = "{" close = ""><mtable><mtr><mtd><mrow><msub><mi>l</mi><mn>1</mn></msub><mo>/</mo><msub><mi>l</mi><mn>3</mn></msub><mo>,</mo><msub><mi>l</mi><mn>1</mn></msub><mo>&GreaterEqual;</mo><msub><mi>l</mi><mn>3</mn></msub></mrow></mtd></mtr><mtr><mtd><mrow><msub><mi>l</mi><mn>3</mn></msub><mo>/</mo><msub><mi>l</mi><mn>1</mn></msub><mo>,</mo><msub><mi>l</mi><mn>3</mn></msub><mo>&gt;</mo><msub><mi>l</mi><mn>1</mn></msub></mrow></mtd></mtr></mtable></mfenced></mrow><mrow><msub><mi>r</mi><mn>3</mn></msub><mo>=</mo><mfenced open = "{" close = ""><mtable><mtr><mtd><mrow><msub><mi>l</mi><mn>1</mn></msub><mo>/</mo><msub><mi>l</mi><mn>2</mn></msub><mo>,</mo><msub><mi>l</mi><mn>1</mn></msub><mo>&GreaterEqual;</mo><msub><mi>l</mi><mn>2</mn></msub></mrow></mtd></mtr><mtr><mtd><mrow><msub><mi>l</mi><mn>2</mn></msub><mo>/</mo><msub><mi>l</mi><mn>1</mn></msub><mo>,</mo><msub><mi>l</mi><mn>2</mn></msub><mo>&gt;</mo><msub><mi>l</mi><mn>1</mn></msub></mrow></mtd></mtr></mtable></mfenced></mrow>3.4计算图像描述子;在triangleSetij={T1,T2,...,Ttn}中,以角度值θ以及其对应的边比值r构成一个新集合descriptorij={(θ1,r1),(θ2,r2),...,(θ3×tn,r3×tn)};重复执行迭代运算3×tn次,将descriptorij映射到Hdim1×dim2,其迭代公式为:<mrow><mi>g</mi><mi>a</mi><mi>p</mi><mn>1</mn><mo>=</mo><mfrac><mi>&pi;</mi><mrow><mi>dim</mi><mn>1</mn></mrow></mfrac></mrow><mrow><mi>g</mi><mi>a</mi><mi>p</mi><mn>2</mn><mo>=</mo><mfrac><mrow><mi>d</mi><mi>i</mi><mi>f</mi><mi>f</mi><mi>e</mi><mi>r</mi><mi>e</mi><mi>n</mi><mi>c</mi><mi>e</mi></mrow><mrow><mi>dim</mi><mn>2</mn></mrow></mfrac></mrow>difference=max{rp}‑min{rp}其中,p=1,2,...,3×tn,s=1,2,...,dim1,t=1,2,...,dim2,max{rp}是对于所有descriptorij中的rp的最大值,min{rp}是对于所有descriptorij中的rp的最小值;3.5将H(3×tn)dim1×dim2向量化,得xij=(d1,d2,...,ddim1×dim2);步骤四,训练分类器;输入c×n个训练实例:<(x11,y1),(x12,y1),...,(x1n,y1),(x21,y2),(x22,y2),...,(x2n,y2),...,(xc2,yc),...,(xcn,yc)>,其中,xij是输入的训练样本,yi∈{1,2,...,c}表示样本对应的标签;4.1归一化权值,公式如下:<mrow><msub><mi>x</mi><mrow><mi>i</mi><mi>j</mi></mrow></msub><mo>=</mo><mfrac><mrow><mo>(</mo><msub><mi>d</mi><mn>1</mn></msub><mo>,</mo><msub><mi>d</mi><mn>2</mn></msub><mo>,</mo><mo>...</mo><mo>,</mo><msub><mi>d</mi><mrow><mi>dim</mi><mn>1</mn><mo>&times;</mo><mi>dim</mi><mn>2</mn></mrow></msub><mo>)</mo></mrow><mrow><mi>max</mi><mo>{</mo><msub><mi>d</mi><mi>p</mi></msub><mo>}</mo></mrow></mfrac></mrow>式中,max{dp}为(d1,d2,...,ddim1×dim2)中的最大值;4.2得到分类器Classifier;步骤五,输入测试图像,根据步骤三对测试图像进行描述,得到图像描述子xij=(d1,d2,...,ddim1×dim2);步骤六,将xij=(d1,d2,...,ddim1×dim2)输入到分类器Classifier中,输出预测的图像类别。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201310397701.9/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top