[发明专利]一种多层稀疏编码特征的鸟类图像识别方法在审

专利信息
申请号: 201510964442.2 申请日: 2015-12-18
公开(公告)号: CN105631469A 公开(公告)日: 2016-06-01
发明(设计)人: 郭礼华 申请(专利权)人: 华南理工大学
主分类号: G06K9/62 分类号: G06K9/62
代理公司: 广州市华学知识产权代理有限公司 44245 代理人: 陈文姬
地址: 510640 广*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种多层稀疏编码特征的鸟类图像识别方法,首先在局部图像块的R,G,B三通道上利用级联多层稀疏编码结构提取稀疏编码特征,每层稀疏编码结构都包含特征编码部分和特征最大值抽取两部分;然后在输出特征上,多层稀疏编码特征使用线性核进行融合,并使用SVM作为分类器进行分类判决。在多层稀疏编码结构中,在优化目标函数中加入了一个局部约束项,在特征编码部分迭代地使用所求得目标函数的近似解进行稀疏编码,然后使用这些编码值最小化重构误差,更新字典。本发明的多层稀疏编码特征的鸟类图像识别方法,能极大提高系统对于鸟类图像的识别精度。
搜索关键词: 一种 多层 稀疏 编码 特征 鸟类 图像 识别 方法
【主权项】:
一种多层稀疏编码特征的鸟类图像识别方法,其特征在于,包括以下步骤:S1训练过程S1.1收集各种鸟类训练图像,组成鸟类训练数据集;S1.2字典学习S1.2.1设定字典学习的目标函数为:<mrow><munder><mrow><mi>m</mi><mi>i</mi><mi>n</mi></mrow><mrow><mi>D</mi><mo>,</mo><mi>X</mi></mrow></munder><mo>|</mo><mo>|</mo><mi>Y</mi><mo>-</mo><mi>D</mi><mi>X</mi><mo>|</mo><msubsup><mo>|</mo><mi>F</mi><mn>2</mn></msubsup><mo>+</mo><mi>&lambda;</mi><munderover><mo>&Sigma;</mo><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></munderover><munderover><mo>&Sigma;</mo><mrow><mi>j</mi><mo>=</mo><mn>1</mn><mo>,</mo><mi>j</mi><mo>&NotEqual;</mo><mi>i</mi></mrow><mi>N</mi></munderover><mo>|</mo><msubsup><mi>d</mi><mi>i</mi><mi>T</mi></msubsup><msub><mi>d</mi><mi>j</mi></msub><mo>|</mo><mo>+</mo><mi>&beta;</mi><munderover><mo>&Sigma;</mo><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></munderover><mo>|</mo><mo>|</mo><msub><mi>e</mi><mi>i</mi></msub><mo>&CenterDot;</mo><msub><mi>x</mi><mi>i</mi></msub><mo>|</mo><msup><mo>|</mo><mn>2</mn></msup><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>1</mn><mo>)</mo></mrow></mrow>其中Y为图像块的像素矩阵集,yi是像素矩阵集Y中第i个图像块的像素矩阵;D是需学习的字典,字典个数为N,字典元素为di和dj;X是字典的权重系数,其元素为xi是F范数,<mrow><msub><mi>e</mi><mi>i</mi></msub><mo>=</mo><mi>exp</mi><mrow><mo>(</mo><msup><mrow><mo>&lsqb;</mo><mi>d</mi><mi>i</mi><mi>s</mi><mi>t</mi><mrow><mo>(</mo><msub><mi>y</mi><mi>i</mi></msub><mo>,</mo><msub><mi>d</mi><mn>1</mn></msub><mo>)</mo></mrow><mo>,</mo><mo>...</mo><mo>,</mo><mi>d</mi><mi>i</mi><mi>s</mi><mi>t</mi><mrow><mo>(</mo><msub><mi>y</mi><mi>i</mi></msub><mo>,</mo><msub><mi>d</mi><mi>N</mi></msub><mo>)</mo></mrow><mo>&rsqb;</mo></mrow><mi>T</mi></msup><mo>/</mo><mi>&sigma;</mi><mo>)</mo></mrow><mo>,</mo></mrow>而dist(yi,dj)是yi与dj的欧式距离,·表示矩阵点乘,σ为权重,λ,β是平衡两种约束的权重系数;S1.2.2计算输入信号像素矩阵集Y的编码系数X,得到的新目标函数如式(2)所示,其解析解如式(3)所示;<mrow><munder><mrow><mi>m</mi><mi>i</mi><mi>n</mi></mrow><mrow><mi>D</mi><mo>,</mo><mi>X</mi></mrow></munder><mo>|</mo><mo>|</mo><mi>Y</mi><mo>-</mo><mi>D</mi><mi>X</mi><mo>|</mo><msubsup><mo>|</mo><mi>F</mi><mn>2</mn></msubsup><mo>+</mo><mi>&beta;</mi><munderover><mo>&Sigma;</mo><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></munderover><mo>|</mo><mo>|</mo><msub><mi>e</mi><mi>i</mi></msub><mo>&CenterDot;</mo><msub><mi>x</mi><mi>i</mi></msub><mo>|</mo><msup><mo>|</mo><mn>2</mn></msup><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>2</mn><mo>)</mo></mrow></mrow><mrow><mi>s</mi><mo>.</mo><mi>t</mi><mo>.</mo><mo>&ForAll;</mo><mi>i</mi><mo>,</mo><msup><mn>1</mn><mi>T</mi></msup><msub><mi>x</mi><mi>i</mi></msub><mo>=</mo><mn>1</mn></mrow><mrow><mfenced open = "{" close = ""><mtable><mtr><mtd><mrow><msub><mi>C</mi><mi>i</mi></msub><mo>=</mo><mrow><mo>(</mo><msup><mi>D</mi><mi>T</mi></msup><mo>-</mo><mn>1</mn><msubsup><mi>y</mi><mi>i</mi><mi>T</mi></msubsup><mo>)</mo></mrow><msup><mrow><mo>(</mo><msup><mi>D</mi><mi>T</mi></msup><mo>-</mo><mn>1</mn><msubsup><mi>y</mi><mi>i</mi><mi>T</mi></msubsup><mo>)</mo></mrow><mi>T</mi></msup></mrow></mtd></mtr><mtr><mtd><mrow><msub><mi>x</mi><mi>i</mi></msub><mo>=</mo><mrow><mo>(</mo><msub><mi>C</mi><mi>i</mi></msub><mo>+</mo><msup><mi>&beta;diag</mi><mn>2</mn></msup><mo>(</mo><mi>e</mi><mo>)</mo></mrow><mo>)</mo><mo>\</mo><mn>1</mn></mrow></mtd></mtr><mtr><mtd><mrow><msub><mi>x</mi><mi>i</mi></msub><mo>=</mo><msub><mi>x</mi><mi>i</mi></msub><mo>/</mo><msup><mn>1</mn><mi>T</mi></msup><msub><mi>x</mi><mi>i</mi></msub></mrow></mtd></mtr></mtable></mfenced><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>3</mn><mo>)</mo></mrow></mrow>S1.2.3在求得编码系数X后,字典中的单词通过KSVD算法按顺序优化更新,目标函数(1)更新为:<mrow><munder><mrow><mi>m</mi><mi>i</mi><mi>n</mi></mrow><msub><mi>d</mi><mi>m</mi></msub></munder><mo>{</mo><msubsup><mover><mi>x</mi><mo>&OverBar;</mo></mover><mi>m</mi><mi>T</mi></msubsup><msub><mover><mi>x</mi><mo>&OverBar;</mo></mover><mi>m</mi></msub><msubsup><mi>d</mi><mi>m</mi><mi>T</mi></msubsup><msub><mi>d</mi><mi>m</mi></msub><mo>-</mo><mn>2</mn><msub><mi>R</mi><mi>m</mi></msub><msub><mover><mi>x</mi><mo>&OverBar;</mo></mover><mi>m</mi></msub><mo>+</mo><mi>&lambda;</mi><munderover><mi>&Sigma;</mi><mrow><mi>j</mi><mo>=</mo><mn>1</mn><mo>,</mo><mi>j</mi><mo>&NotEqual;</mo><mi>m</mi></mrow><mi>N</mi></munderover><mo>|</mo><msubsup><mi>d</mi><mi>j</mi><mi>T</mi></msubsup><msub><mi>d</mi><mi>m</mi></msub><mo>|</mo><mo>}</mo><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>4</mn><mo>)</mo></mrow></mrow>s.t.||dm||2=1其中是X第m行的向量,是像素矩阵集Y关于第m个单词的残差;N是字典总个数;S1.2.3不断地迭代实现步骤S1.2.1~S1.2.2;直到每次迭代运行的字典D不再改变;S1.3利用S1.1得到的字典,采用多层稀疏编码对鸟类训练图像进行稀疏编码稀疏计算,得到稀疏编码特征输出;S1.4分类器训练将步骤S1.3所得的稀疏编码特征输出送入线性支持矢量机分类器,得到不同类别鸟类之间的最大分类平面模型;S2测试过程对测试图像,采用步骤S1.3的方法得到稀疏编码特征输出,送入S1.4的分类器所得的鸟类不同类别之间的最大分类平面模型,判断当前测试图像对应的鸟类类别输出。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201510964442.2/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top