[发明专利]一种基于机械产品历史数据的虚拟样本扩容方法有效

专利信息
申请号: 201910681887.8 申请日: 2019-07-26
公开(公告)号: CN110598243B 公开(公告)日: 2021-04-30
发明(设计)人: 裘乐淼;李恒;张树有;王自立;谭建荣 申请(专利权)人: 浙江大学
主分类号: G06F30/27 分类号: G06F30/27;G06F16/21;G06K9/62;G06N20/00;G06F111/08;G06F111/04
代理公司: 杭州求是专利事务所有限公司 33200 代理人: 邱启旺
地址: 310058 浙江*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 机械 产品 历史数据 虚拟 样本 扩容 方法
【权利要求书】:

1.一种基于机械产品历史数据的虚拟样本扩容方法,其特征在于,包括以下步骤:

(1)读取机械产品的历史数据作为原始训练集D中样本,包括输入特征和输出特征;根据原始训练集D获取潜在参数,包括虚拟样本容量n′和初始化候选样本库容量nDc′

所述输入特征为尺寸公差、形状公差和位置公差;

所述输出特征为装配精度;

所述原始训练集D={(x1,y1),(x2,y2)...,(xn,yn)};其中,n为样本数量,xi是d维输入特征,yi为输出特征,yi为一维向量,i=1~n;

所述虚拟样本容量n′的取值范围为n×22≤n′≤n×2d

所述初始化候选样本库容量nDc′=n′;

(2)基于步骤(1)得到的原始训练集D中特征分布规律,对原始训练集D进行分组复制扩充,得到样本池Dp,包括以下子步骤:

(2.1)确定样本集合Gk:根据步骤(1)得到的输出特征yi数值大小的分布将其划分成K个区间(gk-1,gk],通过下式计算区间端点gk

其中,k=1,2,...,K;ymin为输出特征yi的最小值,ymax为输出特征yi的最大值;当k=1时,第1个区间为(g0,g1],其中g0=ymin;相应地,根据下式将原始训练集D分为K组,得到样本集合Gk

k=1时,G1={Di|g0≤yi≤g1,i=1,2,...,n}

k=2,3,...,K时,Gk={Di|gk-1<yi≤gk,i=1,2,...,n}

其中,Di为原始训练集D中第i个样本;

(2.2)确定样本的扩充数量n′k:对步骤(2.1)得到的样本集合Gk各组中样本分别进行复制,将各组样本集合Gk的样本数量nk扩充为原来的倍,得到扩充样本集合G′k;其中,nk是各组样本集合Gk中的样本数量;

(2.3)将步骤(2.2)得到的扩充样本集合G′k的各组样本共同构成样本池Dp

(3)从步骤(2.3)得到的样本池Dp中随机采样,基于代理模型、雅可比旋量理论设计虚拟样本生成规则,对选中样本进行样本扩容操作,所有扩容操作后得到的候选虚拟样本构成候选虚拟样本库Dc′,包括以下子步骤:

(3.1)输入特征的偏移:从样本池Dp中随机抽取一个样本(xp,yp),通过输入特征偏移操作产生虚拟输入x′p=xp±Δ,其中正负随机确定,偏移量Δ由下式确定:

(3.2)基于雅可比旋量理论构造响应模型J(x′p):根据机械产品装配体装配情况,在各公差的几何中心构建局部坐标系,响应模型J(x′p)根据下式确定:

其中,F为局部坐标系个数;为雅可比矩阵,为公差旋量;

(3.3)输出特征的生成:基于代理模型构造虚拟输出y′p,构造方法为:

y′p=J(x′p)+εp

其中,εp为高斯随机噪声;

(3.4)通过下式计算得到一组候选虚拟样本(x′p,y′p):

(3.5)重复执行步骤(3.1)~(3.4),直至候选虚拟样本数量达到步骤(1)获取的初始化候选样本库容量nDc′,构成候选虚拟样本库Dc′;

(4)对步骤(3.5)构成的候选虚拟样本库Dc′进行样本合理性筛选,保留满足样本合理性判定条件的候选虚拟样本作为虚拟扩容样本,包括以下子步骤:

(4.1)从步骤(3.5)构成的候选虚拟样本库Dc′中随机抽取nm组候选虚拟样本与步骤(1)得到的原始训练集D混合得到混合样本Dm

(4.2)制定合理性判定指标和条件:合理性判定指标Pd(·)包括样本均值E(·)、样本方差σ2(·)、样本偏度Skew(·)、样本峰度Kurt(·),表示为:

Pd(·)={E(·),σ2(·),Skew(·),Kurt(·)}

合理性判定条件为:

Pd(Dm)≥ξPd(D)

其中,ξ为置信度;

(4.3)对步骤(4.1)得到的混合样本Dm根据步骤(4.2)制定的合理性判定条件进行合理性判定,得到虚拟扩容样本,包括以下两种情况:

(4.3.1)如果混合样本Dm的合理性判定指标Pd(·)满足步骤(4.2)中的合理性判定条件,则保留步骤(4.1)抽取的nm组候选虚拟样本,作为虚拟扩容样本;

(4.3.2)如果混合样本Dm的合理性判定指标Pd(·)不满足合理性判定条件,将步骤(4.1)抽取的nm组候选虚拟样本放回候选虚拟样本库Dc′;

(4.4)重复执行步骤(4.1)~(4.3),继续获得虚拟样本容量n′;当保留的虚拟扩容样本数量达到步骤(1)获取的虚拟样本容量n′,或者连续三次筛选未能产生新的虚拟扩容样本,则停止抽取;

(5)判断保留的虚拟扩容样本数量是否达到步骤(1)获取的虚拟样本容量n′,得到虚拟样本集合,包括以下两种情况:

(5.1)如果步骤(4)保留的虚拟扩容样本数量M达到虚拟样本容量n′,则完成虚拟样本扩容,得到虚拟样本集合;

(5.2)如果步骤(4)保留的虚拟扩容样本数量M未达到虚拟样本容量n′,更新候选样本库容量为nDc′=n′-M,并跳转到步骤(3)构成新的候选虚拟样本库Dc′,继续获得虚拟扩容样本,补充不足的部分。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910681887.8/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top