[发明专利]一种基于三角剖分的图像分类方法有效

申请号：	201310397701.9	申请日：	2013-09-04
公开（公告）号：	CN103440511B	公开（公告）日：	2016-11-02
发明（设计）人：	段立娟;张璇;苗军;马伟;杨震;王博岳	申请（专利权）人：	北京工业大学
主分类号：	G06K9/66	分类号：	G06K9/66
代理公司：	北京思海天达知识产权代理有限公司 11203	代理人：	张慧
地址：	100124 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明属于图像处理领域，公开了一种基于三角剖分的图像分类方法，包括：步骤一，输入训练图像；步骤二，检测训练图像集中每幅图像的所有兴趣点，得到每幅图像的点集；步骤三，对兴趣点进行三角剖分，利用角度值及其相邻边比值描述特征点的空间关系，得到图像描述子；步骤四，用图像描述子训练分类器；步骤五，输入测试图像，提取测试图像的图像描述子；步骤六，将测试图像的图像描述子输入分类器进行判别。本发明通过提取局部兴趣点并利用三角剖分技术建立图像的全局关系，得到了全局图像描述子。使用全局图像描述子训练分类器，用训练好的分类器预测图像类别。与传统方法相比，本发明图像描述子构建简单，速度快，效果好。
搜索关键词：	一种基于三角图像分类方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种基于三角剖分的图像分类方法，其特征在于包括以下步骤：步骤一，输入训练图像集，每类选取n张图像作为训练图像I_ij，i＝1,2,...,c；j＝1,2,...,n；步骤二，对训练图像I_ij使用SIFT即尺度不变特征转换算法提取兴趣点，记录兴趣点的坐标，得到图像I_ij的兴趣点集pointSet_ij，i＝1,2,...,c；j＝1,2,...,n；方法如下：2.1使用SIFT算子检测图像I_ij，提取图像I_ij的所有兴趣点；2.2记录步骤一中提取的兴趣点在图像I_ij中的坐标位置，形成图像I_ij的兴趣点集pointSet_ij＝{p₁,p₂,...,p_num}，其中，num是图像I_ij的兴趣点数目，p_k＝(p_kx,p_ky)是兴趣点的空间坐标，k＝1,2,...,num；步骤三，对每幅图像的兴趣点集pointSet_ij使用Delaunay三角剖分技术，得到兴趣点之间的空间关系，构造一个二维矩阵作为图像描述子对图像全局进行描述；方法如下：3.1对步骤二所得图像I_ij的特征点集pointSet_ij进行Delaunay三角剖分变换，将图像I_ij中离散的特征点剖分为不均匀的三角形，构成一个三角网；3.2根据三角网中所有三角形内角的角度值θ以及其相邻的边的比值r，构造一个二维矩阵H⁽⁰⁾_dim1×dim2作为图像描述子，并初始化为0；其中，dim1为矩阵H的行数，2＜dim1＜50；dim2为矩阵H的列数，2＜dim2＜50；3.3由步骤一中得到的三角网依次输出各个三角形的坐标，得到图像I_ij的三角形坐标集triangleSet_ij＝{T₁,T₂,...,T_tn}，其中tn是三角网中三角形的数目；每个三角形由三个坐标组成T_k＝{(t_kx1,t_ky1),(t_kx2,t_ky2),(t_kx3,t_ky3)},k＝1,2,...,tn；三角形的边长用欧式距离计算，公式如下：

<mrow><msub><mi>l</mi><mn>1</mn></msub><mo>=</mo><msqrt><mrow><msup><mrow><mo>(</mo><msub><mi>t</mi><mrow><mi>k</mi><mi>x</mi><mn>3</mn></mrow></msub><mo>-</mo><msub><mi>t</mi><mrow><mi>k</mi><mi>x</mi><mn>2</mn></mrow></msub><mo>)</mo></mrow><mn>2</mn></msup><mo>+</mo><msup><mrow><mo>(</mo><msub><mi>t</mi><mrow><mi>k</mi><mi>y</mi><mn>3</mn></mrow></msub><mo>-</mo><msub><mi>t</mi><mrow><mi>k</mi><mi>y</mi><mn>2</mn></mrow></msub><mo>)</mo></mrow><mn>2</mn></msup></mrow></msqrt></mrow>

<mrow><msub><mi>l</mi><mn>2</mn></msub><mo>=</mo><msqrt><mrow><msup><mrow><mo>(</mo><msub><mi>t</mi><mrow><mi>k</mi><mi>x</mi><mn>3</mn></mrow></msub><mo>-</mo><msub><mi>t</mi><mrow><mi>k</mi><mi>x</mi><mn>1</mn></mrow></msub><mo>)</mo></mrow><mn>2</mn></msup><mo>+</mo><msup><mrow><mo>(</mo><msub><mi>t</mi><mrow><mi>k</mi><mi>y</mi><mn>3</mn></mrow></msub><mo>-</mo><msub><mi>t</mi><mrow><mi>k</mi><mi>y</mi><mn>1</mn></mrow></msub><mo>)</mo></mrow><mn>2</mn></msup></mrow></msqrt></mrow>

<mrow><msub><mi>l</mi><mn>3</mn></msub><mo>=</mo><msqrt><mrow><msup><mrow><mo>(</mo><msub><mi>t</mi><mrow><mi>k</mi><mi>x</mi><mn>2</mn></mrow></msub><mo>-</mo><msub><mi>t</mi><mrow><mi>k</mi><mi>x</mi><mn>1</mn></mrow></msub><mo>)</mo></mrow><mn>2</mn></msup><mo>+</mo><msup><mrow><mo>(</mo><msub><mi>t</mi><mrow><mi>k</mi><mi>y</mi><mn>2</mn></mrow></msub><mo>-</mo><msub><mi>t</mi><mrow><mi>k</mi><mi>y</mi><mn>1</mn></mrow></msub><mo>)</mo></mrow><mn>2</mn></msup></mrow></msqrt></mrow>

由余弦定理求三角形的三个内角θ₁，θ₂，θ₃：

<mrow><msub><mi>θ</mi><mn>1</mn></msub><mo>=</mo><mi>arccos</mi><mrow><mo>(</mo><mo>(</mo><mrow><msubsup><mi>l</mi><mn>2</mn><mn>2</mn></msubsup><mo>+</mo><msubsup><mi>l</mi><mn>3</mn><mn>2</mn></msubsup><mo>-</mo><msubsup><mi>l</mi><mn>1</mn><mn>2</mn></msubsup></mrow><mo>)</mo><mo>/</mo><mo>(</mo><mrow><mn>2</mn><mo>·</mo><msub><mi>l</mi><mn>2</mn></msub><mo>·</mo><msub><mi>l</mi><mn>3</mn></msub></mrow><mo>)</mo><mo>)</mo></mrow></mrow>

<mrow><msub><mi>θ</mi><mn>2</mn></msub><mo>=</mo><mi>arccos</mi><mrow><mo>(</mo><mo>(</mo><mrow><msubsup><mi>l</mi><mn>1</mn><mn>2</mn></msubsup><mo>+</mo><msubsup><mi>l</mi><mn>3</mn><mn>2</mn></msubsup><mo>-</mo><msubsup><mi>l</mi><mn>2</mn><mn>2</mn></msubsup></mrow><mo>)</mo><mo>/</mo><mo>(</mo><mrow><mn>2</mn><mo>·</mo><msub><mi>l</mi><mn>1</mn></msub><mo>·</mo><msub><mi>l</mi><mn>3</mn></msub></mrow><mo>)</mo><mo>)</mo></mrow></mrow>

<mrow><msub><mi>θ</mi><mn>3</mn></msub><mo>=</mo><mi>arccos</mi><mrow><mo>(</mo><mo>(</mo><mrow><msubsup><mi>l</mi><mn>1</mn><mn>2</mn></msubsup><mo>+</mo><msubsup><mi>l</mi><mn>2</mn><mn>2</mn></msubsup><mo>-</mo><msubsup><mi>l</mi><mn>3</mn><mn>2</mn></msubsup></mrow><mo>)</mo><mo>/</mo><mo>(</mo><mrow><mn>2</mn><mo>·</mo><msub><mi>l</mi><mn>1</mn></msub><mo>·</mo><msub><mi>l</mi><mn>2</mn></msub></mrow><mo>)</mo><mo>)</mo></mrow></mrow>

边比值为θ角两个夹边中长边与短边的比值，即：

<mrow><msub><mi>r</mi><mn>1</mn></msub><mo>=</mo><mfenced open = "{" close = ""><mtable><mtr><mtd><mrow><msub><mi>l</mi><mn>3</mn></msub><mo>/</mo><msub><mi>l</mi><mn>2</mn></msub><mo>,</mo><msub><mi>l</mi><mn>3</mn></msub><mo>&GreaterEqual;</mo><msub><mi>l</mi><mn>2</mn></msub></mrow></mtd></mtr><mtr><mtd><mrow><msub><mi>l</mi><mn>2</mn></msub><mo>/</mo><msub><mi>l</mi><mn>3</mn></msub><mo>,</mo><msub><mi>l</mi><mn>2</mn></msub><mo>></mo><msub><mi>l</mi><mn>3</mn></msub></mrow></mtd></mtr></mtable></mfenced></mrow>

<mrow><msub><mi>r</mi><mn>2</mn></msub><mo>=</mo><mfenced open = "{" close = ""><mtable><mtr><mtd><mrow><msub><mi>l</mi><mn>1</mn></msub><mo>/</mo><msub><mi>l</mi><mn>3</mn></msub><mo>,</mo><msub><mi>l</mi><mn>1</mn></msub><mo>&GreaterEqual;</mo><msub><mi>l</mi><mn>3</mn></msub></mrow></mtd></mtr><mtr><mtd><mrow><msub><mi>l</mi><mn>3</mn></msub><mo>/</mo><msub><mi>l</mi><mn>1</mn></msub><mo>,</mo><msub><mi>l</mi><mn>3</mn></msub><mo>></mo><msub><mi>l</mi><mn>1</mn></msub></mrow></mtd></mtr></mtable></mfenced></mrow>

<mrow><msub><mi>r</mi><mn>3</mn></msub><mo>=</mo><mfenced open = "{" close = ""><mtable><mtr><mtd><mrow><msub><mi>l</mi><mn>1</mn></msub><mo>/</mo><msub><mi>l</mi><mn>2</mn></msub><mo>,</mo><msub><mi>l</mi><mn>1</mn></msub><mo>&GreaterEqual;</mo><msub><mi>l</mi><mn>2</mn></msub></mrow></mtd></mtr><mtr><mtd><mrow><msub><mi>l</mi><mn>2</mn></msub><mo>/</mo><msub><mi>l</mi><mn>1</mn></msub><mo>,</mo><msub><mi>l</mi><mn>2</mn></msub><mo>></mo><msub><mi>l</mi><mn>1</mn></msub></mrow></mtd></mtr></mtable></mfenced></mrow>

3.4计算图像描述子；在triangleSet_ij＝{T₁,T₂,...,T_tn}中，以角度值θ以及其对应的边比值r构成一个新集合descriptor_ij＝{(θ₁,r₁),(θ₂,r₂),...,(θ_3×tn,r_3×tn)}；重复执行迭代运算3×tn次，将descriptor_ij映射到H_dim1×dim2，其迭代公式为：

<mrow><mi>g</mi><mi>a</mi><mi>p</mi><mn>1</mn><mo>=</mo><mfrac><mi>π</mi><mrow><mi>dim</mi><mn>1</mn></mrow></mfrac></mrow>

<mrow><mi>g</mi><mi>a</mi><mi>p</mi><mn>2</mn><mo>=</mo><mfrac><mrow><mi>d</mi><mi>i</mi><mi>f</mi><mi>f</mi><mi>e</mi><mi>r</mi><mi>e</mi><mi>n</mi><mi>c</mi><mi>e</mi></mrow><mrow><mi>dim</mi><mn>2</mn></mrow></mfrac></mrow>

difference＝max{r_p}‑min{r_p}其中，p＝1,2,...,3×tn,s＝1,2,...,dim1,t＝1,2,...,dim2，max{r_p}是对于所有descriptor_ij中的r_p的最大值，min{r_p}是对于所有descriptor_ij中的r_p的最小值；3.5将H^(3×tn)_dim1×dim2向量化，得x_ij＝(d₁,d₂,...,d_dim1×dim2)；步骤四，训练分类器；输入c×n个训练实例：＜(x₁₁,y₁),(x₁₂,y₁),...,(x_1n,y₁),(x₂₁,y₂),(x₂₂,y₂),...,(x_2n,y₂),...,(x_c2,y_c),...,(x_cn,y_c)＞，其中，x_ij是输入的训练样本，y_i∈{1,2,...,c}表示样本对应的标签；4.1归一化权值，公式如下：

<mrow><msub><mi>x</mi><mrow><mi>i</mi><mi>j</mi></mrow></msub><mo>=</mo><mfrac><mrow><mo>(</mo><msub><mi>d</mi><mn>1</mn></msub><mo>,</mo><msub><mi>d</mi><mn>2</mn></msub><mo>,</mo><mo>...</mo><mo>,</mo><msub><mi>d</mi><mrow><mi>dim</mi><mn>1</mn><mo>×</mo><mi>dim</mi><mn>2</mn></mrow></msub><mo>)</mo></mrow><mrow><mi>max</mi><mo>{</mo><msub><mi>d</mi><mi>p</mi></msub><mo>}</mo></mrow></mfrac></mrow>

式中，max{d_p}为(d₁,d₂,...,d_dim1×dim2)中的最大值；4.2得到分类器Classifier；步骤五，输入测试图像，根据步骤三对测试图像进行描述，得到图像描述子x_ij＝(d₁,d₂,...,d_dim1×dim2)；步骤六，将x_ij＝(d₁,d₂,...,d_dim1×dim2)输入到分类器Classifier中，输出预测的图像类别。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京工业大学，未经北京工业大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201310397701.9/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于三角剖分的图像分类方法有效

专利文献下载