[发明专利]一种基于关联规则的MBD数据集完整性检查方法有效
申请号: | 201510015049.9 | 申请日: | 2015-01-12 |
公开(公告)号: | CN104598569B | 公开(公告)日: | 2017-12-29 |
发明(设计)人: | 于勇;王宏;赵罡;印璞;顾黎 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京慧泉知识产权代理有限公司11232 | 代理人: | 王顺荣,唐爱华 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于关联规则的MBD数据集完整性检查方法,步骤如下一、将需要定义到MBD数据集中的设计、制造、检测、管理信息细化分解,将所有条目进行编码并由计算机管理和发布;二、记录MBD数据集定义历史记录;三、对历史记录中数据进行清洗;四、使用关联规则算法对MBD数据集构建历史记录进行关联规则挖掘;五、将获得所有频繁项集导入频繁集数据库中,将获得关联关系及其置信度值导入关系数据库中;六、获得需进行完整性检测MBD数据集所有标准工程注释,提取其中包含最多项的强关联项集Ck;七、查询该规则的置信度并排序;八、查询该规则的置信度并排序。本发明将非几何信息规范化,并进行统一编码管理,准确性高,有很好的适应性。 | ||
搜索关键词: | 一种 基于 关联 规则 mbd 数据 完整性 检查 方法 | ||
【主权项】:
一种基于关联规则的MBD数据集完整性检查方法,其特征在于:该方法的具体步骤如下:步骤一:将企业中需要定义到一种基于模型定义即MBD数据集中的设计、制造、检测、管理信息细化分解,并将所有条目进行编码并由计算机管理和发布,其中每一条目都称为一条标准工程注释信息,也构成关联规则中的每一项;步骤二:记录MBD数据集定义历史记录,将MBD数据集中产品代号,标准注释编码,保存在历史记录数据库中,每一条历史记录都构成关联规则中的一个事务数据;步骤三:对历史记录中数据进行清洗,去除一些无意义和噪声数据;步骤四:使用关联规则算法对MBD数据集构建历史记录进行关联规则挖掘,其详细过程如下:1)提取频繁项集对于关联规则:X→Y,其支持度是指事务中含X∪Y项事务的百分比,计算公式为(X∪Y)count/N,其中(X∪Y)count为事务集中出现X∪Y项的数量;对于支持度大于及等于给定最小支持度的项集称为频繁项集;利用重复迭代的方法,从1‑项集开始,根据给定支持度阈值获得频繁1‑项集L1;由频繁1‑项集组合生成2‑项集,根据给定的支持度阈值对候选的2‑项集进行剪枝,获得频繁2‑项集,依次类推,直到产生最多项的频繁项集Ls为止;2)计算关联规则置信度对于关联规则中,置信度是指事物集中出现X∪Y数量占X项数量的百分比,计算公式为(X∪Y)count/(X)count,其中(X)count为事务集中出现X项的次数;对于频繁项集Lk,其中对于任意项I,计算关联规则(Lk‑I)→I置信度;对于置信度大于及等于给定最小置信度的关联规则,称为强关联规则,否则为弱关联规则,采用不断迭代的方法计算频繁项集中关联规则的置信度值,并由置信度值对规则进行排序;步骤五:将获得所有频繁项集导入频繁项集数据库中,将获得关联关系及其置信度值导入关系数据库中,便于后续数据集完整性检查调用;步骤六:获得需进行完整性检测MBD数据集所有标准工程注释,提取其中包含最多项的强关联项集Ck,即提取待检测MBD数据集中任意两项标准工程注释均为强关联规则的最长的频繁项集;步骤七:以待检测MBD数据集中最长频繁项集为规则头,分别以数据集其他项为规则尾,查询该规则的置信度并排序,设定关联强度值,给出低于设定关联强度值项,即MBD数据集中包含冗余项;步骤八:以待检测MBD数据集中最长频繁项集为规则头,以不包含在MBD数据集中标准库其他项为规则尾,查询该规则的置信度并排序,设定关联强度值,给出低于设定关联强度值项,即MBD数据集中缺失项。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510015049.9/,转载请声明来源钻瓜专利网。
- 上一篇:图片搜索方法和装置
- 下一篇:多媒体资源推荐方法及装置