[发明专利]一种基于监督式机器学习的车辆部件建模方法有效
申请号: | 202210478749.1 | 申请日: | 2022-05-05 |
公开(公告)号: | CN114580086B | 公开(公告)日: | 2022-08-09 |
发明(设计)人: | 李文博;王伟;曲辅凡;王长青;颜燕 | 申请(专利权)人: | 中汽研汽车检验中心(天津)有限公司;中国汽车技术研究中心有限公司 |
主分类号: | G06F30/15 | 分类号: | G06F30/15;G06F30/27;G06K9/62;G06N20/10 |
代理公司: | 天津企兴智财知识产权代理有限公司 12226 | 代理人: | 薛萌萌 |
地址: | 300300 天津市*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 监督 机器 学习 车辆 部件 建模 方法 | ||
1.一种基于监督式机器学习的车辆部件建模方法,其特征在于:包括以下步骤:
S1、确定车辆部件模型中待机器学习建模技术部分需要输出的目标信号;
在步骤S1中的所述车辆部件模型包括利用机器学习建模技术搭建的部分和利用传统建模技术搭建的部分;需要输出的目标信号指车辆部件建模中使用的传统建模技术难以处理,需要机器学习建模技术处理的信号;
S2、根据步骤S1中需要输出的目标信号设计试验方案;
S3、按试验方案对真实车辆部件进行试验,并收集建模部件不同工况下测试数据;
S4、对步骤S3中汇总的测试数据进行预处理,得到预处理后的目标信号;
在步骤S4中的测试数据预处理包括以下步骤:
A1、加载和读取测试数据;
A2、将测试数据中偏离均值正负三倍标准差的数据点视为异常数据点,利用正态分布图法来清除异常数据点,得到缺失测试数据;
A3、对步骤A2中的缺失测试数据填充,得到完整测试数据;
A4、对步骤A3中的完整测试数据进行过滤信号噪声;
S5、对步骤S4中预处理后的目标信号划分得到训练集T和测试集D,并从训练集T中抽取n个训练子集;
在步骤S5中的对步骤S4预处理后的目标信号划分得到训练集T和测试集D,从训练集T中抽取n个训练子集包括以下步骤:
B1、判断预处理后的目标信号的数据样本量是否少于20万条;
B2、是,则将预处理后的目标信号以2:8的比例划分测试集D和训练集T,并进入步骤B4;
B3、否,则将预处理后的目标信号以2:2:6的比例划分测试集D、验证集和训练集T,并进入步骤B4;
B4、从容量为N的训练集T中,采取自主抽样法抽取N个样本,作为一个训练子集;
B5、重复n次步骤B1-步骤B4,得到n个训练子集;
S6、利用特征选择和特征变化提取n个训练子集的相关特征,从n个训练子集的相关特征中随机选取属性,做节点分裂属性,形成一个决策树;重复n次提取相关特征、随机选取属性、形成决策树的步骤,生成n个决策树,将n个决策树组合起来,得到随机森林机器学习模型;
在步骤S6中的所述随机森林机器学习模型的得到包括以下步骤:
C1、导入利用步骤S6得到的相关特征,从相关特征中利用信息增益公式,分别计算每一个相关特征的信息增益,选择信息增益最大的相关特征作为响应变量,响应变量作为步骤C2中得到的随机森林机器学习模型的输出;
通过以下公式计算信息增益:
假设有k类特征:
C1,C2,C3...Ck
每个特征出现的概率是:
P(C1),P(C2),P(C3),...P(Ck)
每个特征的信息熵计算如下:
每个数据在所有特征中出现的概率是:
P(data)
每个数据不出现的概率是:
条件熵的计算公式如下:
其中,H(C|data)是数据的信息熵,是不出现该数据的信息熵;
总的信息增益公式是:
IG(T)=H(C)-H(C|T);
C2、将步骤C1中的相关特征做节点分类属性,形成一个决策树;重复n次提取相关特征-选取属性-形成决策树的步骤,生成n个决策树,将n个决策树组合起来,得到随机森林机器学习模型;
C3、在训练集T下,配置随机森林机器学习模型的以下参数:决策树个数、树的最大深度、分割内部节点的最小样本数和每棵树用的最大特征数;
决策树个数:决策树个数为100;
树的最大深度:将数的最大深度参数max_depth设置为None,让节点拟合到信息增益为0;
分割内部节点的最小样本数:将分割内部节点设置的最小样本数min_sample_leaf,设置为1,意义在于当叶子节点样本数小于节点最小样本数min_sample_leaf,则对该叶子节点进行剪枝,只留下该叶子节点的父节点;
每棵树用的最大特征数:设置为None;
C4、训练利用步骤C3配置得到的模型;
C5、判断步骤C4中的模型是否满足要求,是,则执行步骤S7,否,则回到步骤C1;
S7、利用步骤S6中的随机森林机器学习模型获得分类边界、关键阈值、关键性能曲线和关键性能曲面;
在步骤S7中利用步骤S6中的随机森林机器学习模型获得分类边界、关键阈值、关键性能曲线和关键性能曲面包括以下步骤:
D1、利用测试集D,根据真实值的幅值和跨度确定最小步长为最小时间间隔的5%;
D2、通过线性插值,根据最小步长将输入信号的真实值每个间隔进行等间距划分,得到扩充后的输入信号;
D3、将步骤D2中的扩充后的输入信号传递给训练好的随机森林机器学习模型,得到随机森林机器学习模型计算的输出结果;
D4、分析步骤D3中的输出结果获得分类边界、关键阈值、关键性能曲线和关键性能曲面;
S8、导出随机森林机器学习模型至车辆部件模型并应用;
在步骤S8中的所述导出随机森林机器学习模型至车辆部件模型并应用包括以下步骤:
E1、配置随机森林机器学习模型的输入接口、输出接口;
E2、将随机森林机器学习模型输出为C代码文件;
E3、将C代码文件编译为车辆部件建模平台接口文件;
E4、将步骤E3中的编译后的接口文件链接至车辆部件建模平台中的车辆部件模型;
S9、根据步骤S7获得的分类边界、关键阈值、关键性能曲线、关键性能曲面及步骤S8导出的随机森林机器学习模型,通过传统建模技术完成建模。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中汽研汽车检验中心(天津)有限公司;中国汽车技术研究中心有限公司,未经中汽研汽车检验中心(天津)有限公司;中国汽车技术研究中心有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210478749.1/1.html,转载请声明来源钻瓜专利网。