[发明专利]一种基于动态增量式字典更新的学习算法在审
申请号: | 201410758958.7 | 申请日: | 2015-08-04 |
公开(公告)号: | CN104504015A | 公开(公告)日: | 2015-07-29 |
发明(设计)人: | 王力哲;刘鹏;耿浩;王托弟 | 申请(专利权)人: | 中国科学院遥感与数字地球研究所 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京纽乐康知识产权代理事务所(普通合伙) 11210 | 代理人: | 覃莉 |
地址: | 100094*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 动态 增量 字典 更新 学习 算法 | ||
技术领域
本发明涉及面向海量遥感数据的稀疏表达技术,具体来说,涉及一种基于动态增量式字典更新的学习算法。
背景技术
近年来,信号的稀疏表达吸引了很多科研人员的关注,稀疏表达的应用范围也非常广泛,包括数据压缩,特征提取等等;稀疏表达是指训练一个过完备字典,该字典是由多个原子组成,信号则表示成这些原子的线性组合;它主要包含两个步骤:稀疏表达与字典学习,而字典学习过程的不同也是区别不同算法的重要因素;字典主要有两大类:解析字典与非解析字典,解析字典由于原子固定,对于复杂的数据集,不能很好的保证分解后的稀疏性;非解析字典则能够根据数据特征自适应的训练出相应的字典,更能有效的稀疏的表示原始数据。
然而经典的字典学习算法,例如K-SVD算法等,需要一次性的输入所有的训练样本集,当训练数据体量扩大后,样本将不再能一次性输入训练,显然,传统的稀疏表达算法在大数据稀疏表示问题上显得力不从心。
针对相关技术中的问题,目前尚未提出有效的解决方案。
发明内容
本发明的目的是提供一种基于动态增量式字典更新的学习算法,以克服目前现有技术存在的上述不足。
本发明的目的是通过以下技术方案来实现:
一种基于动态增量式字典更新的学习算法,包括以下步骤:
选取预训练样本集,初始化初始字典,确定所述初始字典将要增加的原子个数m;
基于OMP算法,用初始字典对输入样本进行稀疏表征,得到最初稀疏系数矩阵;
根据所述最初稀疏系数矩阵,计算表征后的剩余误差,并且,在所述剩余误差大于预定阈值的情况下,向所述初始字典增加m个原子,并基于信息熵,对所述m个原子初始化;
将进行初始化后的所述m个原子添加至所述初始字典中,得到新字典矩阵,并且,基于OMP算法,利用所述新字典矩阵对所述输入样本进行稀疏分解;
基于稀疏分解后的输入样本,利用K-SVD算法对增量原子进行更新,确定误差最小的增量原子,并对确定的所述误差最小的增量原子去相关;
当所有样本训练结束,输出最终的字典。
进一步的,还包括:
在所述剩余误差小于预定阈值的情况下,不更新所述初始字典,继续输入下一样本;
进一步的,对确定的所述误差最小的增量原子去相关包括:
计算伽马矩阵G=DTD,其中D是所述新字典矩阵;
将伽马矩阵映射至结构化约束集:首先将伽马矩阵的对角线元素置为1,再对伽马矩阵进行阈值量化;
因式分解伽马矩阵并映射至光谱约束集;
对矩阵进行翻转;
重复上述过程直至达到事先设定的迭代次数,输出最终的字典。
本发明的有益效果为:基于稀疏系数的信息熵来初始化增量原子,此后运用K-SVD算法对增量原子进行更新,再迭代映射翻转对增量原子矩阵去相关,使得我们能够对体量庞大的遥感数据集进行更有效更稀疏的表征;大大减少了数据的存储空间,简化了后续的数据分析和处理难度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例所述的一种基于动态增量式字典更新的学习算法的流程图;
图2是本发明实施例所述的一种基于动态增量式字典更新的学习算法的增量原子初始化示意图;
图3是本发明实施例所述的一种基于动态增量式字典更新的学习算法的增量原子更新示意图;
图4是本发明实施例所述的一种基于动态增量式字典更新的学习算法的增量原子去相关示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本发明保护的范围。
如图1-4所示,根据本发明实施例所述的一种基于动态增量式字典更新的学习算法,包括以下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院遥感与数字地球研究所,未经中国科学院遥感与数字地球研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410758958.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:实体词热度计算方法及装置
- 下一篇:一种多对多的数据采集系统及其采集方法