[发明专利]一种智能工厂中多模态制造数据预处理的方法在审
申请号: | 201910540327.0 | 申请日: | 2019-06-21 |
公开(公告)号: | CN110275868A | 公开(公告)日: | 2019-09-24 |
发明(设计)人: | 王维龙;杨开益;郭文水;梅雪松 | 申请(专利权)人: | 厦门嵘拓物联科技有限公司;厦门数孪科技有限公司 |
主分类号: | G06F16/16 | 分类号: | G06F16/16;G06F16/172;G06F16/182;G06Q50/04 |
代理公司: | 厦门市精诚新创知识产权代理有限公司 35218 | 代理人: | 何家富 |
地址: | 361001 福建省厦门*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 制造数据 多模态 集成模型 训练集 神经网络模型 预处理 聚类结果 构建 工业数据采集系统 保障数据 多级优化 使用数据 智能 数据处理 聚类 去噪 填充 清洗 采集 分类 环节 | ||
本发明涉及一种智能工厂中多模态制造数据预处理的方法,包括:S1:接收工业数据采集系统所采集的制造数据,并将其构成训练集D;S2:对训练集D进行聚类得到聚类结果,构建神经网络模型,根据训练集D和其聚类结果对神经网络模型进行训练后得到最终的多模态制造数据集成模型;S3:通过多模态制造数据集成模型对需要处理的制造数据集进行分类;S4:对制造数据集进行去噪处理;S5:对制造数据集进行去冗处理;S6:识别制造数据集中的缺失值,对缺失值进行填充。本发明通过构建多模态制造数据集成模型将多模态制造数据按模型簇聚类,便于后续环节的数据处理;使用数据多级优化清洗策略,提高数据质量,保障数据正确性、一致性、完整性和可靠性。
技术领域
本发明涉及智能制造和数据管理技术领域,尤其涉及一种智能工厂中多模态制造数据预处理的方法。
背景技术
在智能工厂工业大数据时代下,海量多模态制造数据广泛存在,如何从这些制造数据中挖掘出隐藏的巨大价值,是现阶段工业大数据研究关注的主要问题。然而多模态制造数据的模态低质性、处理实时性、模态不均衡性和属性高维性为数据挖掘的设计实施提出了严峻挑战。而在智能工厂的数据挖掘过程中,数据预处理大约需要花费整个过程60%的时间。因此,如何更高效地完成多模态制造数据预处理,保障数据正确性、一致性、完整性和可靠性已是智能工厂中数据挖掘成功的关键。
现阶段,数据预处理主要包括数据清洗、数据集成、数据变换、数据规约等,各步骤又可细分为更小、更精确的具体执行单元。一方面,在绝大多数领域的数据预处理过程需要结合该应用领域的知识,数据预处理模块大多以组件的方式嵌入在数据挖掘平台中,模块耦合程度高。另一方面,在针对多模态制造数据预处理过程中,大多需要相关领域专家的干预,当处理过程中出现异常情况时,通常需要人工进行辅助决策,效率低,已无法满足智能工厂中的实际需求。
发明内容
为了解决上述问题,本发明提供了一种智能工厂中多模态制造数据预处理的方法。
具体方案如下:
一种智能工厂中多模态制造数据预处理的方法,包括以下步骤:
S1:接收工业数据采集系统所采集的制造数据,并将其构成训练集D=(d1,d2,…dx,…,dn),其中n为数据的个数;
S2:对训练集D进行聚类得到聚类结果,构建神经网络模型,根据训练集D和其聚类结果对神经网络模型进行训练后得到最终的多模态制造数据集成模型;
所述对训练集D进行聚类包括以下步骤:
S201:初始化参数:
将训练集D划分为z组,每组的聚类中心设为Cy,其中下标y=1,2,3,…,z,设定迭代次数h=0、最大迭代次数H和阈值ε;
S202:用在[0,1]范围内的随机数构建x×y的隶属度矩阵L,矩阵中的任意元素Lxy满足如下公式:
其中,Lxy表示训练集D中的数据x对于聚类中心Cy的隶属程度;
S203:判断迭代次数h是否小于最大迭代次数H,若小于,则设定h=h+1,进入S204,否则,进入S208;
S204:计算每组的聚类中心Cy:
S205:计算目标函数J:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门嵘拓物联科技有限公司;厦门数孪科技有限公司,未经厦门嵘拓物联科技有限公司;厦门数孪科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910540327.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种提取解析安卓手机文件的方法
- 下一篇:一种扁平文件处理方法及相关装置