[发明专利]一种智能工厂中多模态制造数据预处理的方法在审

申请号：	201910540327.0	申请日：	2019-06-21
公开（公告）号：	CN110275868A	公开（公告）日：	2019-09-24
发明（设计）人：	王维龙;杨开益;郭文水;梅雪松	申请（专利权）人：	厦门嵘拓物联科技有限公司;厦门数孪科技有限公司
主分类号：	G06F16/16	分类号：	G06F16/16;G06F16/172;G06F16/182;G06Q50/04
代理公司：	厦门市精诚新创知识产权代理有限公司 35218	代理人：	何家富
地址：	361001 福建省厦门***	国省代码：	福建;35
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	制造数据多模态集成模型训练集神经网络模型预处理聚类结果构建工业数据采集系统保障数据多级优化使用数据智能数据处理聚类去噪填充清洗采集分类环节
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明涉及一种智能工厂中多模态制造数据预处理的方法，包括：S1：接收工业数据采集系统所采集的制造数据，并将其构成训练集D；S2：对训练集D进行聚类得到聚类结果，构建神经网络模型，根据训练集D和其聚类结果对神经网络模型进行训练后得到最终的多模态制造数据集成模型；S3：通过多模态制造数据集成模型对需要处理的制造数据集进行分类；S4：对制造数据集进行去噪处理；S5：对制造数据集进行去冗处理；S6：识别制造数据集中的缺失值，对缺失值进行填充。本发明通过构建多模态制造数据集成模型将多模态制造数据按模型簇聚类，便于后续环节的数据处理；使用数据多级优化清洗策略，提高数据质量，保障数据正确性、一致性、完整性和可靠性。

技术领域

本发明涉及智能制造和数据管理技术领域，尤其涉及一种智能工厂中多模态制造数据预处理的方法。

背景技术

在智能工厂工业大数据时代下，海量多模态制造数据广泛存在，如何从这些制造数据中挖掘出隐藏的巨大价值，是现阶段工业大数据研究关注的主要问题。然而多模态制造数据的模态低质性、处理实时性、模态不均衡性和属性高维性为数据挖掘的设计实施提出了严峻挑战。而在智能工厂的数据挖掘过程中，数据预处理大约需要花费整个过程60％的时间。因此，如何更高效地完成多模态制造数据预处理，保障数据正确性、一致性、完整性和可靠性已是智能工厂中数据挖掘成功的关键。

现阶段，数据预处理主要包括数据清洗、数据集成、数据变换、数据规约等，各步骤又可细分为更小、更精确的具体执行单元。一方面，在绝大多数领域的数据预处理过程需要结合该应用领域的知识，数据预处理模块大多以组件的方式嵌入在数据挖掘平台中，模块耦合程度高。另一方面，在针对多模态制造数据预处理过程中，大多需要相关领域专家的干预，当处理过程中出现异常情况时，通常需要人工进行辅助决策，效率低，已无法满足智能工厂中的实际需求。

发明内容

为了解决上述问题，本发明提供了一种智能工厂中多模态制造数据预处理的方法。

具体方案如下：

一种智能工厂中多模态制造数据预处理的方法，包括以下步骤：

S1：接收工业数据采集系统所采集的制造数据，并将其构成训练集D＝(d₁,d₂,…d_x,…,d_n)，其中n为数据的个数；

S2：对训练集D进行聚类得到聚类结果，构建神经网络模型，根据训练集D和其聚类结果对神经网络模型进行训练后得到最终的多模态制造数据集成模型；

所述对训练集D进行聚类包括以下步骤：

S201：初始化参数：

将训练集D划分为z组，每组的聚类中心设为C_y，其中下标y＝1,2,3,…,z，设定迭代次数h＝0、最大迭代次数H和阈值ε；

S202：用在[0,1]范围内的随机数构建x×y的隶属度矩阵L，矩阵中的任意元素L_xy满足如下公式：

其中，L_xy表示训练集D中的数据x对于聚类中心C_y的隶属程度；

S203：判断迭代次数h是否小于最大迭代次数H，若小于，则设定h＝h+1，进入S204，否则，进入S208；