[发明专利]基于核极限学习机的样本处理方法及系统在审
申请号: | 202010841786.5 | 申请日: | 2020-08-20 |
公开(公告)号: | CN111985103A | 公开(公告)日: | 2020-11-24 |
发明(设计)人: | 熊伟丽;代学志 | 申请(专利权)人: | 江南大学 |
主分类号: | G06F30/20 | 分类号: | G06F30/20;G06N20/00 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 楼高潮 |
地址: | 214122 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 极限 学习机 样本 处理 方法 系统 | ||
本发明提供基于核极限学习机的样本处理方法及系统,方法包括:识别预处理样本集中的无标记样本及有标记样本,确定无标记样本集及有标记样本集作为处理对象;基于KELM算法从所述无标记样本集中选取满足预设要求的无标记样本,构成第一子样本集;将所述第一子样本集中的样本进行标记,得到带有标记的第二子样本集,将第二子样本集加入所述有标记样本集,得到更新后的有标记样本集;若所述有标记样本集与更新后的有标记样本集的相似度满足预设要求,则基于更新后的有标记样本集进行软测量。本方案,迭代更新速度快,稳定性高,应用于复杂化工过程建模,可大大降低主动学习的运算成本,并减少人工标记代价,更有效地实现过程质量变量的软测量。
技术领域
本发明属于工业生产过程软测量建模和应用领域,特别涉及一种基于核极限学习机的样本处理方法及系统。
背景技术
在复杂工业过程中,需要对一些决定产品质量的关键变量进行监测和控制,但由于现场环境以及技术条件的制约,使得这些变量难以在线测量。软测量是工业过程中用于解决难测变量检测的常用技术,通过训练集构建数学模型,实现对新样本质量变量的实时估计。常见的软测量模型包括支持向量回归、人工神经网络、高斯过程回归和极限学习机等。
软测量技术通常需要大量有标记样本才能完成模型训练,而在实际工业过程中常常是无标记样本数量多,有标记样本数量较少,而且获取成本高。在这种情况下,如何利用大量无标记数据和少量标记数据来提升模型性能成为软测量建模的关键问题。采用上述软测量模型稳定性较差,在复杂化工过程建模时运算成本较高。
发明内容
本发明提供一种基于核极限学习机的样本处理方法及系统,以解决现有技术方案中软测量模型稳定性较差,在复杂化工过程建模时运算成本较高的技术问题。
第一方面,根据本发明实施例提供的基于核极限学习机的样本处理方法,应用于软测量中,包括:
步骤S12、识别预处理样本集中的无标记样本及有标记样本,确定无标记样本集及有标记样本集作为处理对象;
步骤S14、基于KELM算法从所述无标记样本集中选取满足预设要求的无标记样本,构成第一子样本集;
步骤S16、将所述第一子样本集中的样本进行标记,得到带有标记的第二子样本集,将第二子样本集加入所述有标记样本集,得到更新后的有标记样本集;其中,在对第一子样本集中的样本进行标记之后,从所述无标记样本集中去除所述第一子样本集中的样本,得到更新后的无标记样本集;
步骤S18、若所述有标记样本集与更新后的有标记样本集的相似度满足预设要求,则基于更新后的有标记样本集进行软测量。
在一个实施例中,所述方法,还包括:
若所述有标记样本集与更新后的有标记样本集的相似度不满足预设要求,则确定更新后的有标记样本集与更新后的无标记样本集构成的样本集为预处理样本集,并迭代执行步骤S12、步骤S14、步骤S16及步骤S18,直到第K次更新后的有标记样本与第K-1次更新后的有标记样本的相似度满足要求,则基于第K次更新后的有标记样本进行软测量。
在一个实施例中,所述基于KELM算法从所述无标记样本集中选取满足预设要求的无标记样本,构成第一子样本集,包括:
计算所述无标记样本集中的无标记样本的置信度;
选取置信度满足预设要求的无标记样本,构成第一子样本集。
在一个实施例中,所述方法,还包括:
步骤S171、分别求取第k-1次更新后的有标记样本的协方差矩阵Rk及第k次更新后的有标记样本的协方差矩阵Rk+1;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江南大学,未经江南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010841786.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:多乘客乘坐车辆
- 下一篇:领域短语词典构建方法