[发明专利]一种智能工厂中多模态制造数据预处理的方法在审
申请号: | 201910540327.0 | 申请日: | 2019-06-21 |
公开(公告)号: | CN110275868A | 公开(公告)日: | 2019-09-24 |
发明(设计)人: | 王维龙;杨开益;郭文水;梅雪松 | 申请(专利权)人: | 厦门嵘拓物联科技有限公司;厦门数孪科技有限公司 |
主分类号: | G06F16/16 | 分类号: | G06F16/16;G06F16/172;G06F16/182;G06Q50/04 |
代理公司: | 厦门市精诚新创知识产权代理有限公司 35218 | 代理人: | 何家富 |
地址: | 361001 福建省厦门*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 制造数据 多模态 集成模型 训练集 神经网络模型 预处理 聚类结果 构建 工业数据采集系统 保障数据 多级优化 使用数据 智能 数据处理 聚类 去噪 填充 清洗 采集 分类 环节 | ||
1.一种智能工厂中多模态制造数据预处理的方法,其特征在于,包括以下步骤:
S1:接收工业数据采集系统所采集的制造数据,并将其构成训练集D=(d1,d2,...dx,...,dn),其中n为数据的个数;
S2:对训练集D进行聚类得到聚类结果,构建神经网络模型,根据训练集D和其聚类结果对神经网络模型进行训练后得到最终的多模态制造数据集成模型;
所述对训练集D进行聚类包括以下步骤:
S201:初始化参数:
将训练集D划分为z组,每组的聚类中心设为Cy,其中下标y=1,2,3,...,z,设定迭代次数h=0、最大迭代次数H和阈值ε;
S202:用在[0,1]范围内的随机数构建x×y的隶属度矩阵L,矩阵中的任意元素Lxy满足如下公式:
其中,Lxy表示训练集D中的数据x对于聚类中心Cy的隶属程度;
S203:判断迭代次数h是否小于最大迭代次数H,若小于,则设定h=h+1,进入S204,否则,进入S208;
S204:计算每组的聚类中心Cy:
S205:计算目标函数J:
其中,Fxy=||Dx-Cy||,表示训练集中第x个数据到第y组的聚类中心Cy的欧几理德距离;
S206:判断目标函数J是否小于阈值ε,若小于,则进入S208,否则,进入S207;
S207:更新隶属度矩阵,返回S203,其中隶属度矩阵的更新公式为:
其中,k为参数变量;
S208:输出聚类结果Lx:
其中:Lx为训练集D中的数据x的聚类划分,公式表示当x固定时,查找最大的Lxy;
S3:通过多模态制造数据集成模型对需要处理的制造数据集进行分类;
S4:对制造数据集进行去噪处理;
S5:对制造数据集进行去冗处理;
S6:识别制造数据集中的缺失值,对缺失值进行填充。
2.根据权利要求1所述的方法,其特征在于:步骤S2中,所述神经网络模型为三层BP神经网络,其输入层神经元个数m=7,输出层神经元个数n=1,隐含层神经元个数p由公式确定。
3.根据权利要求1所述的方法,其特征在于:步骤S4中的去噪处理具体为:
S401:加载制造数据集;
S402:构建噪声识别函数:
其中,x表示制造数据集中的数据,μ表示制造数据集中数据的均值,σ表示标准差;
S403:任取制造数据集中的数据,计算噪声识别函数f(x),针对制造数据,若其在噪声识别函数f(x)的(μ-1.5σ,μ+1.5σ)以外的概率小于0.15%时,则判定x为噪声数据;
S404:清除噪声数据,直至制造数据集中所有数据均计算完成。
4.根据权利要求1所述的方法,其特征在于:步骤S5的去冗处理具体为:
S501:加载制造数据集;
S502:针对制造数据集中的每个数据,将其划分为若干个数据块,计算每个数据块的64位加权哈希值并按位累加,若每位大于1则记1,否则记0,生成指纹集;
S503:针对指纹集中的每个指纹,两两比对每两个“指纹”之间的码距,若码距小于设定的阈值时,判定为冗余数据;
S504:清除冗余数据,直至所有指纹均比对完毕。
5.根据权利要求1所述的方法,其特征在于:步骤S6具体为:
S601:加载制造数据集;
S602:采用决策树分类法定位制造数据集中缺失值的具体位置,识别缺失值的属性;
S603:查找制造数据集中与缺失值的对应属性具有相邻时间区域的所有数值;
S6O4:计算查找的数值的平均值并将平均值填充至缺失值位置处。
6.根据权利要求1所述的方法,其特征在于:所述的制造数据通过分布式文件系统HDFS进行存储,采用Spark大数据处理引擎、Spark弹性分布式数据集的形式进行缓存。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门嵘拓物联科技有限公司;厦门数孪科技有限公司,未经厦门嵘拓物联科技有限公司;厦门数孪科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910540327.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种提取解析安卓手机文件的方法
- 下一篇:一种扁平文件处理方法及相关装置