[发明专利]基于R-SVM的TFT-LCD工业智能预测方法在审
申请号: | 201910092644.0 | 申请日: | 2019-01-30 |
公开(公告)号: | CN109871992A | 公开(公告)日: | 2019-06-11 |
发明(设计)人: | 张涛;冯宇婷;郝兵 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q10/06;G06Q50/04 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 沈波 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 预测 工业智能 随机森林 样本集合 预测结果 传统的 高维数据 核心过程 模型训练 特征集合 特征空间 鲁棒性 特征集 小样本 验证集 样本集 放入 构建 样本 筛选 表现 | ||
本发明公开了基于R‑SVM的TFT‑LCD工业智能预测方法,本发明将传统svm与随机森林的思想进行了结合,使最终预测结果,更加具有鲁棒性,更可靠。同时,svm本身就适用于高维数据,大型特征空间的训练,在小样本数据上表现较好。实现该方法的核心过程在于样本与特征集合的构建并与最终svm的结合上。传统的svm模型对于特征与样本集合不做太多的筛选与判断,对于整个样本集合都选择直接放入模型中进行训练。基于随机森林的思想,本发明考虑在模型训练的过程中,组成多个不同的样本集与特征集并且结合传统的svm模型进行训练。将训练得到的多个svm模型再对最后的验证集分别进行预测,取所有预测的均值作为最终的预测结果。
技术领域
本发明是一种基于R-SVM的TFT-LCD薄膜晶体管液晶显示器)工业智能预测方法。
背景技术
半导体产业是一个信息化程度高的产业。高度的信息化给数据分析创造了可能性。基于数据的分析可以帮助半导体产业更好的利用生产信息,提高产品质量。现有的解决方案是,生产机器生产完成后,对产品质量做非全面的抽测,进行产品质量检核。这往往会出现以下状况,一是不能即时的知道质量的好坏,当发现质量不佳的产品时,要修正通常都为时以晚,二是在没有办法全面抽测的状况下,存在很大漏检的风险。在机器学习,人工智能快速发展的今天,希望由机器生产参数去预测产品的质量,来达到生产结果即时性以及全面性。更进一步的,可基于预先知道的结果,去做对应的决策及应变,对客户负责,也对制造生产更加敏感。传统的机器学习方法都对数据型预测做出了很大的贡献。单一性的方法有线性回归,实现简单,计算简单并且可解释性强,适用于连续型数据的预测;Svm可解决高维问题,大型特征空间,提高泛化能力;决策树计算简单,易于理解,适用于有缺失属性的样本,高效应对大数据集;knn理论成熟,思想简单等。集成算法包括bagging与boosting类的多种算法。其中运行效果较好的是随机森林方法,解决了决策树的过拟合问题,并且提高了模型的鲁棒性,发挥了较好的作用。集成算法在单一算法的基础上有了一些进步,但是也存在自身的弊端。例如随机森林在解决回归问题时,并不像分类问题的效果那么理想。尤其是在处理小样本数据的时候,效果也是不甚满意。
发明内容
考虑到上述问题,本发明提出了一种基于随机svm的工业智能预测方法。由于上述方法改变了传统的svm训练方式,将传统svm与随机森林的思想进行了结合,使最终预测结果,更加具有鲁棒性,更可靠。同时,svm本身就适用于高维数据,大型特征空间的训练,在小样本数据上表现较好。
本发明采用的技术方案为基于R-SVM的TFT-LCD工业智能预测方法,本方法数据来源于阿里天池工业智能制造质量预测公开数据集,数据列包括生产TFT-LCD的工业制作过程。共有8029列,600个样本。
该方法的实现过程包括如下步骤:
步骤1,数据预处理;
步骤2,pca降维;
步骤3,模型搭建;
步骤4,多模型判断优异;
步骤5,模型预测;
步骤6,mse判定。
步骤1,数据预处理。在数据预处理部分,首先对8029列数据中的离散型数据进行了处理。根据离散型数据列与最终Y值的影响做了一元方差分析。根据离散型列值分析对数据进行了encoder型编码。对数据样本进行去空,重复列去重,对单个空缺值进行填补(使用前一值进行补充)。
步骤2,PCA降维。在降维阶段,使用pca降维技术,因为数据中没有关于各个列值的具体说明,所以直接采用pca降维的方法。在降维过程中,前300列包含有数据98%以上的信息,在降维阶段保留前300列的数据信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910092644.0/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理