[发明专利]一种基于机械产品历史数据的虚拟样本扩容方法有效
申请号: | 201910681887.8 | 申请日: | 2019-07-26 |
公开(公告)号: | CN110598243B | 公开(公告)日: | 2021-04-30 |
发明(设计)人: | 裘乐淼;李恒;张树有;王自立;谭建荣 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06F30/27 | 分类号: | G06F30/27;G06F16/21;G06K9/62;G06N20/00;G06F111/08;G06F111/04 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 邱启旺 |
地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 机械 产品 历史数据 虚拟 样本 扩容 方法 | ||
本发明公开了一种基于机械产品历史数据的虚拟样本扩容方法,首先根据实测历史数据确定了小样本问题中虚拟样本的虚拟样本容量;接着基于机械生产的历史数据及机械生产相关先验知识,构建了用于产生虚拟样本的样本池;然后基于“轮盘赌”抽样思想进行样本采样,基于代理模型思想与雅可比旋量理论设计了虚拟样本生成规则;最后通过样本合理性判定条件保留可行的扩容样本,由此实现了用于机械装配精度预测的小样本回归问题训练虚拟样本扩容。本发明成果可用于小容量样本机器学习训练模型样本容量扩充,可解决机械装配精度预测中遇到的样本数量不足的问题,对利用机器学习回归方法研究定制产品公差传递的小样本问题具有重要意义。
技术领域
本发明涉及一种虚拟样本扩容方法,具体涉及一种基于机械产品历史数据的虚拟样本扩容方法。
背景技术
基于大样本数据的机器学习技术已在不同领域得到了广泛应用。随着智能制造概念的提出,机器学习技术与机械领域的结合也日趋紧密。然而随着机械设计及制造水平的不断提高,机械产品出现设计需求多样化、非标化及个性化定制生产的趋势,从而导致部分机械领域问题不再具备产生大容量样本数据的条件,进而限制了机器学习技术的应用。
目前在机械领域机器学习多局限于图像识别、信号辨识等样本数量充足的应用场景。且多数情况下为目标识别等分类问题。传统机械设计相关领域小容量样本的机器学习回归问题尚未得到充分重视。目前公差传递研究多采用公差分析方法,此类方法多以线性传递模型进行公差传递研究,并不考虑非线性误差。机器学习技术的引入有助于改善这一现状。
复杂机械产品多为小批量个性化定制生产,在产品的装配精度预测与偏差控制过程中必然面对小样本问题。目前利用虚拟样本扩容技术的机械领域相关研究多局限于样本标签明确或易于获得的应用场景,比如单体小样本生成。回归类问题的虚拟样本生成方法研究较少。
针对机械产品装配精度预测而言,实际加工中影响零件质量的因素多种多样。生产设备精度、人员操作因素以及生产固有“噪声”等因素导致了不同厂家生产的零件尺寸服从某一特定概率分布。目前研究多采用高斯分布近似代替实际产品尺寸分布模型。产生的数据样本与实际生产情况可能并不一致。因此引入研究问题的历史数据,并通过虚拟样本生成方法进行扩充,有助于引入机械领域先验知识。
发明内容
本发明的目的在于针对现有技术的不足,提供一种基于机械产品历史数据的虚拟样本扩容方法。
本发明的目的是通过以下技术方案来实现的:一种基于机械产品历史数据的虚拟样本扩容方法,包括以下步骤:
(1)读取机械产品的历史数据作为原始训练集D中样本,包括输入特征和输出特征;根据原始训练集D获取潜在参数,包括虚拟样本容量n′和初始化候选样本库容量nDc′;
所述输入特征为尺寸公差、形状公差和位置公差;
所述输出特征为装配精度;
所述原始训练集D={(x1,y1),(x2,y2)...,(xn,yn)};其中,n为样本数量,xi是d维输入特征,yi为输出特征,yi为一维向量,i=1~n。
所述虚拟样本容量n′的取值范围为n×22≤n′≤n×2d;
所述初始化候选样本库容量nDc′=n′;
(2)基于步骤(1)得到的原始训练集D中特征分布规律,对原始训练集D进行分组复制扩充,得到样本池Dp,包括以下子步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910681887.8/2.html,转载请声明来源钻瓜专利网。