[发明专利]一种张量模式下的有监督学习优化方法及系统在审
申请号: | 201510882461.0 | 申请日: | 2015-12-04 |
公开(公告)号: | CN105654110A | 公开(公告)日: | 2016-06-08 |
发明(设计)人: | 王书强;曾德威;施昌宏;卢哲 | 申请(专利权)人: | 深圳先进技术研究院 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 深圳中一专利商标事务所 44237 | 代理人: | 张全文 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 张量 模式 监督 学习 优化 方法 系统 | ||
技术领域
本发明属于模式识别技术领域,尤其涉及一种张量模式下的有监督学习优化方法 及系统。
背景技术
随着大数据时代的到来,数据的张量表达逐渐成为主流。然而,在实现本发明过程 中,发明人发现现有技术还是采用向量模式算法处理张量数据。根据向量模式算法的观点, 须在预处理阶段对原始数据进行特征提取(向量化),这样,一是容易破坏张量数据特有的 空间信息及内在相关性,二是模型参数过多,容易导致维度灾难、过学习、小样本等问题。
许多张量模式算法成为时代的新宠。然而,STM的目标函数求解是非凸优化问题, 需要利用交替投影方法求解,算法的时间复杂度很高,并且常遭遇局部最小值问题。
发明内容
有鉴于此,本发明实施例提供一种张量模式下的有监督学习优化方法及系统,以 解决现有技术提供的向量模式算法,在处理张量数据时出现的维度灾难、过学习、小样本等 问题,克服现有的张量模式算法,本发明的算法是为了解决现有算法的局限,比如存在算法 的时间复杂度很高,并且常遭遇局部最小值等问题。
第一方面,提供一种张量模式下的有监督学习优化方法,所述方法包括:
接收输入的训练张量数据集;
将类内散布矩阵引入目标函数,使得目标函数最大化类间距离的同时最小化类内 距离;
构建最优投影张量机OPSTM子问题的目标函数的优化框架;
将N个向量模式的二次规划子问题转化为单个张量模式下的多重二次规划问题, 构建OPSTM问题的目标函数的优化框架;
根据拉格朗日乘子法,得到所述目标函数的优化框架的对偶问题,并将张量秩一 分解引入到张量内积的计算,得到修改后的对偶问题;
利用序列最小优化SMO算法,求解修改后的对偶问题,输出拉格朗日的最优组合及 偏移标量b;
计算投影张量W*;
对投影张量W*进行秩一分解;
对投影张量W*进行秩一分解后得到的分量进行逆投影;
对经过逆投影后的分量,进行秩一分解逆运算,得到训练张量数据集对应的最优 投影张量W;
构建决策函数阶段,将最优投影张量W经过秩一分解后和偏移标量b一起构建决策 函数;
在应用预测阶段,待预测张量数据经过秩一分解后,输入到所述决策函数中,进行 预测。
进一步地,通过eta系数η将类内散布矩阵引入STM子问题的目标函数后,第n个子 问题的二次规划问题的目标函数变为:
其中,是训练张量数据集沿第n阶展开后估计的第n阶类内散布矩阵,w(n)是训练张量数据集的第n阶的最优投影向量,n=1,2,……N,C是惩罚因子,是松弛变量,eta系数η用于衡量类内散布矩阵的重要性。
进一步地,OPSTM问题的目标函数的优化框架是N个向量模式二次规划问题的组 合,分别对应着一个子问题,其中,第n个子问题的二次规划问题为:
其中,为训练张量数据集的第n阶的投影向量,Λ(n)和P(n)满足E是单位矩阵,是训练张量数据集中的张量输入数据Xm沿各阶投影后得到的张量输入数据,×i是i-mode乘运算符,b(n)为训练张量数据集的第n阶的偏移标量。
进一步地,根据公式和公式将N个向量模式的二次规划子问题转化为单个张量模式下的多重二次规划问题,构建的OPSTM问题的目标函数的优化框架满足:
其中,<>是内积运算符,
进一步地,根据拉格朗日乘子法,得到所述目标函数的优化框架的对偶问题为:
0<αm<Cm=1,2,…M;
将张量秩一分解引入到张量内积的计算,得到修改后的对偶问题为:
0<αm<Cm=1,2,…M。
进一步地,根据公式计算投影张量W*。
第二方面,提供一种张量模式下的有监督学习优化系统,所述系统包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳先进技术研究院,未经深圳先进技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510882461.0/2.html,转载请声明来源钻瓜专利网。