[发明专利]一种基于PLM数据库面向DPIPP工艺信息的挖掘算法有效
申请号: | 201610173409.2 | 申请日: | 2016-03-24 |
公开(公告)号: | CN105787113B | 公开(公告)日: | 2019-03-19 |
发明(设计)人: | 雷金;彭卫平;窦俊豪;张秋华;蒋瑞;胡向阳;雷佻钰 | 申请(专利权)人: | 武汉大学 |
主分类号: | G06F16/903 | 分类号: | G06F16/903;G06F17/16 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 鲁力 |
地址: | 430072 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 plm 数据库 面向 dpipp 工艺 信息 挖掘 算法 | ||
1.一种基于PLM数据库面向DPIPP工艺信息的挖掘方法,其特征在于,包括:
步骤1,数据进行预处理的步骤:对数据进行规范化处理;数据规范化是将原始数据的格式进行统一,并将源数据转化到同一个度量单位上,这样做可以消除原始数据对计算结果的影响;本发明采取的规范化方法如下:对于结构属性,它表示产品或零件的结构参数,为数值型数据且大小不一;因此需要将这些数据转换到同一个度量单位上,然后将这些数据映射到同一区间,最后将所有数据保留相同的有效位;为便于后续的计算将结构参数映射到[0.00,1.00]之间,并统一保留小数点后两位有效数字;经过转化之后,每个结构参数将变为取值范围统一的无度量值;
步骤2,对产品进行聚类分析的步骤:具体方法是:首先设置聚类参数:K、C、α、a,其中,K代表聚类的个数,C为聚类代表点数,α为聚类收缩因子,a为阈值;对于一个由p个组件构成的产品模块,每个组件的某个属性(结构、功能或工艺)有n个参数,建立其属性参数矩阵如下:
首先从源数据中抽取一个随机样本S,将样本S分割为一组划分;然后对每个划分进行局部聚类,聚类时首先将每个对象看作一个类,计算出所有类之间的距离,取距离最近的两个类进行合并,合并后的类被当作一个新的类;然后按照收缩因子α从合并后的类中选出C个代表点,这些代表点将代表该类继续与其他的类进行聚类,直到类的数量达到预先设定的值K;在聚类过程中,如果一个类增长地太慢,就将该类去掉;根据上面的过程可以知道,聚类前需要确定的参数有:需要聚类的个数K,聚类代表点数C和聚类收缩因子α;其中K依据聚类需求进行确定;C依据数据规模进行选取,大规模数据就取较大的值,小规模数据就取较小的值;α取值在0.2~0.7之间聚类结果较好;
步骤3,进行局部聚类的步骤:在准备好聚类数据后需要对选出的样本用基于欧式距,离公式改进算法进行局部聚类,用聚类算法挖掘出产品模块工艺之间的相似性,得出产品模块工艺等价模型,具体是:
聚类时将距离最近的两个类进行合并,类X和类Y之间的距离用函数d(X,Y)来表示;定义由p个组件构成的产品模块Mp和由q个组件构成的产品模块Mq的参数矩阵分别如下:
它们之间距离计算公式如下:
该公式首先计算两个模块间产品间的距离,然后将所有距离求和,最后将和值标准化,使距离d(Mp,Mq)∈[0,1];该距离公式可以计算维度不相等的两个模块间的距离,并满足一般距离公式的要求,即:d(A,B)=d(B,A);d(A,A)=0;
最后基于类间合并方法控制相似度μ进行距离合并:首先令相似度μ=1-d,由d的取值范围可知μ∈[0.00,1.00];然后选取一个聚类相似度阈值a,该阈值根据企业自身需求选取,可选取以下方法作为参考:选取多组明显相似的产品数据,按照本方法进行相似度计算,取各组计算相似度值的平均值为阈值a;在计算出所有类间的相似度μ后,取μ≥a的类,也就是选取出相似度为a以上的类。
2.根据权利要求1所述的一种基于PLM数据库面向DPIPP工艺信息的挖掘方法,其特征在于,在完成一次聚类后,按照CURE算法的流程,需要从合并后的类中取出代表点参与后续的聚类;CURE算法中,类的代表点通过如下方式产生:首先计算类的中心点,第一个点为该类中离中心点最远的点,第二个点为离第一个点最远的点,依次类推,直到取出最多C个点,然后将这些点按照收缩因子α向中心点收缩,经过收缩后的点就是该类的代表点;这样取出的代表点可以真实地反映出该类的形状;在对产品模块聚类分析时,由于每个模块的属性参数是一个矩阵,因此先将每个参数矩阵看做一个点,然后按照中心点计算公式计算出中心矩阵,再根据收缩因子α计算出代表矩阵;定义类Lp和类Lq合并为一个新的类Lp,q,以|Lp|和|Lq|分别表示这两个类所含产品模块的个数,以Lp.mean和Lq.mean分别表示这两个类的中心矩阵,以Lp,q.mean表示合并后的类的中心矩阵,以Lp,q.rep1,Lp,q.rep2,……,Lp,q.repC表示合并后的类的代表矩阵,那么代表矩阵的计算过程是这样的:
首先按照下列公式计算出中心矩阵
然后按照收缩因子α计算出代表矩阵
Lp,q·repi=Li+α*(Lp,q·mean-Li)
取出代表矩阵后由代表矩阵代表合并后的类参与后续的聚类,依次进行下去,聚类时剔除掉过小的类和增长过慢的类,直到所有类停止增长或者达到所需要的聚类数k;在使用本发明提出的类间合并方法后,后续聚类时需要将所有代表矩阵间的相似度计算出来,然后同样通过控制相似度μ完成类间合并;由于采用了控制相似度阈值a的方法,合并时需要进行一次重复性筛选,剔除重复的类;需要说明的是不像最小距离聚类,每次聚类无论怎样都会有两个类被合并,在采用控制相似度阈值a的方法后,聚类时可能会出现所有类不再增长的现象,这是因为现有的所有的类的相似度达不到相似度阈值a,因此在所有类不再增长时会停止聚类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610173409.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:基于混合引擎的大数据处理方法及系统
- 下一篇:一种大数据冗余检测方法