[发明专利]基于增量半监督核极限学习机的在线手写体数字识别方法有效
申请号: | 202010693621.8 | 申请日: | 2020-07-17 |
公开(公告)号: | CN112861594B | 公开(公告)日: | 2023-07-28 |
发明(设计)人: | 杨丽霞;张瑞;魏立力;刘国军 | 申请(专利权)人: | 宁夏大学 |
主分类号: | G06V30/32 | 分类号: | G06V30/32;G06V30/244;G06V10/82;G06N3/0895;G06N3/09;G06N3/0499 |
代理公司: | 银川瑞海陈知识产权代理事务所(普通合伙) 64104 | 代理人: | 贠天娥 |
地址: | 750000 宁夏回*** | 国省代码: | 宁夏;64 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 增量 监督 极限 学习机 在线 手写体 数字 识别 方法 | ||
1.一种基于增量半监督核极限学习机的在线手写体数字识别方法,其特征在于:基于增量半监督核极限学习机的在线手写体数字识别方法包括以下步骤:
步骤一,给定标记样本和未标记样本,通过拉普拉斯正则项提取标记样本和未标记样本信息;
步骤二,建立核极限学习机模型,监督极限学习机找出一个映射函数和极限学习机的一个特征映射,确定极限学习机的训练目标,学得一个权值矩阵,使得映射函数和特征映射之间的差值最小,将权值向量转化为一个正则优化,然后建立核极限学习机模型;
步骤三,建立增量半监督极限学习机,并给出迭代解析解;
步骤四,标记和未标记样本中包含的信息被累积在迭代解析解中,半监督极限学习机在任意时刻给出一个判别决策函数,通过判别决策函数,识别新得到的测试样本;
核极限学习机模型建立的具体方法为:
给定l个标记样本,和u个未标记样本(N=l+u),其中是第i个样本的输入,d是样本的维数,是xi(i=1,…,l)的对应目标,c是样本的类别数;如果xi属于第j类,则否则,监督学习的目标是找出一个映射函数使得f(xi)≈yi(i=1,2,…,l);极限学习机通过L个激活函数的线性组合通过公式一来表示;
公式一表示监督学习的目标找出的映射函数关系;其中是隐层与输出层之间的连接权值矩阵,h(x)=[h1(x),h2(x),...,hL(x)]是极限学习机的特征映射;
极限学习机的训练目标是学得一个权值矩阵W使得f(xi)与yi(i=1,2,…,l)之间的差值最小;
将优化权值矩阵W转化为一个L2正则优化;
其中C是均衡训练误差和模型复杂度的正则化参数,是度量期望输出与实际输出之间误差的松弛向量;公式二的解析解为
其中表示隐层与输出层之间联系的权值矩阵,和分别是隐层的输出矩阵和目标矩阵;如果不再使用显式特征映射,而是如SVM核方法一样,用核函数k(x,y)=h(x)·h(y)表示这种映射关系,函数k是任何满足核定义的核函数,被称为极限学习机核;核矩阵显式的表示为ELM模型重写为
公式四为核极限学习机模型;
增量半监督核极限学习机模型的建立方法为:
其中是训练目标矩阵,它的前l行为其余元素为0,λ是均衡参数,H是全部训练样本所对应的隐层输出矩阵,L=D-S是全部训练样本所对应的图拉普拉斯矩阵,仿射矩阵S的第ij个元素
NB(xi)是xi的近邻集,D是主对角元素为的对角矩阵;公式五中输出权值的闭型最优解为:
因此给定测试样本的输出函数为
得到一个半监督核极限学习机;
假设在时间t,已经被学习的数据记为其中是所有训练样本的输入,是已标记样本的输出;在时间t+1,新获取的数据块为其中是新增训练样本的输入,是数据块中已标记样本的输出;
为了简化运算,在公式六和公式七中将At记为
t+1时间的图拉普拉斯矩阵被表述为
其中Lt和LIC分别为Xt和XIC对应的图拉普拉斯矩阵;St,IC是由Xt到XIC的仿射矩阵,SIC,t是由XIC到Xt的仿射矩阵,Dt,IC和DIC,t分别是主对角元素为矩阵,St,IC及SIC,t的行元素之和的对角矩阵;另外,t+1时间的核矩阵被表述为
其中Ωt和ΩIC分别为Xt和XIC对应的核矩阵,Kt,IC=k(Xt,XIC);
根据时间t与t+1之间的关系,At+1被表示为
其中Ct=Dt,ICKt,IC-St,ICΩIC,Ft=DIC,tΩIC-St,ICKt,IC;令Ut=(IN+λLt)Kt,IC,为了降低计算代价,用分块矩阵求逆公式求矩阵At+1的逆
其中因此,给定一个核函数k(x,y)和极少数已标记样本和少量未标记样本,得出增量半督导核极限学习机的算法:
初始化处理:给定N0个初始训练样本其中包含个已标记样本,其输出为并选定一个核函数k(x,y),参数C和λ;
对于初始训练样本分别计算图拉普拉斯矩阵L0和核矩阵Ω0=k(X0,X0);
初始化参数
设置t=0;
在线增量学习处理;
重复以下步骤:
给定第t+1个接收的数据块
对最新的数据块计算图拉普拉斯矩阵LIC及核矩阵ΩIC=k(XIC,XIC),Kt,IC=k(Xt,XIC);
计算参数
计算Ut=(IN+λLt)Kt,IC,
计算
设置t=t+1,返回初始化处理步骤;
在线预测处理:假设所有训练样本的数目为τ,用学习所得的参数估计给定测试样本Xtest的输出即为手写体数字识别的结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宁夏大学,未经宁夏大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010693621.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:半导体装置的金属选用结构
- 下一篇:控制器和具有控制器的存储器系统