[发明专利]一种多层稀疏编码特征的鸟类图像识别方法在审
申请号: | 201510964442.2 | 申请日: | 2015-12-18 |
公开(公告)号: | CN105631469A | 公开(公告)日: | 2016-06-01 |
发明(设计)人: | 郭礼华 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 陈文姬 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种多层稀疏编码特征的鸟类图像识别方法,首先在局部图像块的R,G,B三通道上利用级联多层稀疏编码结构提取稀疏编码特征,每层稀疏编码结构都包含特征编码部分和特征最大值抽取两部分;然后在输出特征上,多层稀疏编码特征使用线性核进行融合,并使用SVM作为分类器进行分类判决。在多层稀疏编码结构中,在优化目标函数中加入了一个局部约束项,在特征编码部分迭代地使用所求得目标函数的近似解进行稀疏编码,然后使用这些编码值最小化重构误差,更新字典。本发明的多层稀疏编码特征的鸟类图像识别方法,能极大提高系统对于鸟类图像的识别精度。 | ||
搜索关键词: | 一种 多层 稀疏 编码 特征 鸟类 图像 识别 方法 | ||
【主权项】:
一种多层稀疏编码特征的鸟类图像识别方法,其特征在于,包括以下步骤:S1训练过程S1.1收集各种鸟类训练图像,组成鸟类训练数据集;S1.2字典学习S1.2.1设定字典学习的目标函数为: 其中Y为图像块的像素矩阵集,yi是像素矩阵集Y中第i个图像块的像素矩阵;D是需学习的字典,字典个数为N,字典元素为di和dj;X是字典的权重系数,其元素为xi;是F范数, 而dist(yi,dj)是yi与dj的欧式距离,·表示矩阵点乘,σ为权重,λ,β是平衡两种约束的权重系数;S1.2.2计算输入信号像素矩阵集Y的编码系数X,得到的新目标函数如式(2)所示,其解析解如式(3)所示; S1.2.3在求得编码系数X后,字典中的单词通过KSVD算法按顺序优化更新,目标函数(1)更新为: s.t.||dm||2=1其中是X第m行的向量,是像素矩阵集Y关于第m个单词的残差;N是字典总个数;S1.2.3不断地迭代实现步骤S1.2.1~S1.2.2;直到每次迭代运行的字典D不再改变;S1.3利用S1.1得到的字典,采用多层稀疏编码对鸟类训练图像进行稀疏编码稀疏计算,得到稀疏编码特征输出;S1.4分类器训练将步骤S1.3所得的稀疏编码特征输出送入线性支持矢量机分类器,得到不同类别鸟类之间的最大分类平面模型;S2测试过程对测试图像,采用步骤S1.3的方法得到稀疏编码特征输出,送入S1.4的分类器所得的鸟类不同类别之间的最大分类平面模型,判断当前测试图像对应的鸟类类别输出。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510964442.2/,转载请声明来源钻瓜专利网。
- 上一篇:一种矩阵变量RBM的识别方法
- 下一篇:一种基于密度峰值的高效层次聚类方法