[发明专利]一种基于关联规则的MBD数据集完整性检查方法有效
申请号: | 201510015049.9 | 申请日: | 2015-01-12 |
公开(公告)号: | CN104598569B | 公开(公告)日: | 2017-12-29 |
发明(设计)人: | 于勇;王宏;赵罡;印璞;顾黎 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京慧泉知识产权代理有限公司11232 | 代理人: | 王顺荣,唐爱华 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 关联 规则 mbd 数据 完整性 检查 方法 | ||
1.一种基于关联规则的MBD数据集完整性检查方法,其特征在于:该方法的具体步骤如下:
步骤一:将企业中需要定义到一种基于模型定义即MBD数据集中的设计、制造、检测、管理信息细化分解,并将所有条目进行编码并由计算机管理和发布,其中每一条目都称为一条标准工程注释信息,也构成关联规则中的每一项;
步骤二:记录MBD数据集定义历史记录,将MBD数据集中产品代号,标准注释编码,保存在历史记录数据库中,每一条历史记录都构成关联规则中的一个事务数据;
步骤三:对历史记录中数据进行清洗,去除一些无意义和噪声数据;
步骤四:使用关联规则算法对MBD数据集构建历史记录进行关联规则挖掘,其详细过程如下:
1)提取频繁项集
对于关联规则:X→Y,其支持度是指事务中含X∪Y项事务的百分比,计算公式为(X∪Y)count/N,其中(X∪Y)count为事务集中出现X∪Y项的数量;对于支持度大于及等于给定最小支持度的项集称为频繁项集;利用重复迭代的方法,从1-项集开始,根据给定支持度阈值获得频繁1-项集L1;由频繁1-项集组合生成2-项集,根据给定的支持度阈值对候选的2-项集进行剪枝,获得频繁2-项集,依次类推,直到产生最多项的频繁项集Ls为止;
2)计算关联规则置信度
对于关联规则中,置信度是指事物集中出现X∪Y数量占X项数量的百分比,计算公式为(X∪Y)count/(X)count,其中(X)count为事务集中出现X项的次数;对于频繁项集Lk,其中对于任意项I,计算关联规则(Lk-I)→I置信度;对于置信度大于及等于给定最小置信度的关联规则,称为强关联规则,否则为弱关联规则,采用不断迭代的方法计算频繁项集中关联规则的置信度值,并由置信度值对规则进行排序;
步骤五:将获得所有频繁项集导入频繁项集数据库中,将获得关联关系及其置信度值导入关系数据库中,便于后续数据集完整性检查调用;
步骤六:获得需进行完整性检测MBD数据集所有标准工程注释,提取其中包含最多项的强关联项集Ck,即提取待检测MBD数据集中任意两项标准工程注释均为强关联规则的最长的频繁项集;
步骤七:以待检测MBD数据集中最长频繁项集为规则头,分别以数据集其他项为规则尾,查询该规则的置信度并排序,设定关联强度值,给出低于设定关联强度值项,即MBD数据集中包含冗余项;
步骤八:以待检测MBD数据集中最长频繁项集为规则头,以不包含在MBD数据集中标准库其他项为规则尾,查询该规则的置信度并排序,设定关联强度值,给出低于设定关联强度值项,即MBD数据集中缺失项。
2.根据权利要求1所述的一种基于关联规则的MBD数据集完整性检查方法,其特征在于:在步骤二中所述的“产品代号”,是指MBD数据集所对应产品零件及组件的编号,其方式依据企业具体标准,具有唯一性。
3.根据权利要求1所述的一种基于关联规则的MBD数据集完整性检查方法,其特征在于:在步骤三中所述的“无意义和噪声数据”,是指历史记录数据中MBD数据集中仅包含标准工程注释的条目低于及高于事务的数量,且这种事务的数量在总体事务所占比例少,为了提高算法效率,将这些数据剔除。
4.根据权利要求1所述的一种基于关联规则的MBD数据集完整性检查方法,其特征在于:在步骤四中所述的“关联规则算法”,是指寻找描述数据库中数据项之间潜在的关联关系算法,从而找出工程注释项之间的未知依赖关系。
5.根据权利要求1所述的一种基于关联规则的MBD数据集完整性检查方法,其特征在于:在步骤四中所述“频繁项集”,是指支持度大于最小支持度阈值的项集;所述的“最小支持度”,是指由候选集生成频繁项集的阈值,是由人工指定的一个常量;所述的“最小置信度”,是指由判断该规则是否为强规则的阈值,是由人工指定的一个常量。
6.根据权利要求1所述的一种基于关联规则的MBD数据集完整性检查方法,其特征在于:在步骤六中所述的“强关联项集”,是指任意两项间关联规则为强关联规则频繁项集,用于作为一个MBD数据集的核心,并作为MBD数据集完整性判断的规则头,进而判断其他项与“强关联项集”关联关系来判断MBD数据集的完整性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510015049.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:图片搜索方法和装置
- 下一篇:多媒体资源推荐方法及装置