[发明专利]一种基于决策树算法的变压器色谱峰定性方法和系统有效
申请号: | 201910851009.6 | 申请日: | 2019-09-10 |
公开(公告)号: | CN110632191B | 公开(公告)日: | 2023-04-18 |
发明(设计)人: | 单杰;陈昊旻;张政国;卜冠南 | 申请(专利权)人: | 福建工程学院 |
主分类号: | G01N30/02 | 分类号: | G01N30/02;G01N30/86;G06N5/01;G06F18/214;G06F18/241 |
代理公司: | 浙江千克知识产权代理有限公司 33246 | 代理人: | 裴金华 |
地址: | 350118 福建省福州*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 决策树 算法 变压器 色谱 定性 方法 系统 | ||
1.一种基于决策树算法的变压器色谱峰定性方法,其特征在于,包括以下步骤:
S10:数据准备与选取:从现场变压器油色谱在线监测装置中提取获得训练样本集、测试样本集以及特征属性集,所述特征属性集至少包括峰高、峰宽、峰面积以及峰位置;
S20:决策树模型构建:利用决策树算法对所述训练样本集进行训练,构建决策树,构建过程包括训练样本集的特征属性阈值自适应、决策树结点特征属性的选取以及依据特征属性阈值和结点特征属性递归形成决策树;
所述训练样本集的特征属性阈值自适应包括以下步骤:
S211:利用二分法处理所述训练样本集,获取训练样本集的每个特征属性的候选划分点集合;定义h,w,s和p分别为训练样本集D中特征属性峰高、峰宽、峰面积和峰位置的连续属性;h,w,s和p在训练样本集D上出现了V个可能的取值,将这些取值从小到大进行排序,分别记为:峰高:{h1,h2,h3…,hV};峰宽:{w1,w2,w3,…,wV};峰面积:{s1,s2,s3…,sV};峰位置:{p1,p2,p3,…,pV};对连续属性峰高h,考察包含(V-1)个元素的候选分点集合,该集合为;
S212:从每个特征属性的所述候选划分点集合中选取最优划分点作为该特征属性的阈值,最优划分点的判定以信息增益作为评判标准;
S30:结果测试:利用所述测试样本集测试所述决策树,查看结果是否符合预设标准,若符合,则使用所述决策树用于变压器色谱峰定性;
所述步骤S30之后还包括:
S40:决策树模型重构建:用于若测试结果不符合预设标准,则添加训练样本进入所述训练样本集,并重复步骤S10之后的步骤直至步骤S30判断出测试结果符合预设标准,及时添加新的训练样本进入所述训练样本集,有利于调整出符合实际分类标准的决策树,新的训练样本从现场变压器油色谱在线监测装置中提取获得;
所述步骤S212中包括:
计算每个特征属性的所述候选划分点集合中的每个候选划分点对训练样本集进行划分所获得的信息增益;
选取信息增益最大的候选划分点作为该特征属性的阈值;
所述决策树结点特征属性的选取包括:
S221:计算每个特征属性阈值的增益率;
S222:选取增益率最大的所述特征属性作为决策树结点;
所述依据特征属性阈值和结点特征属性递归形成决策树包括:
重复执行步骤S211、S212、S221以及S222,确定决策树的根结点和每个分支的结点,直至数据分类结束,形成最终的决策树;
形成完整的决策树只需要重复继续步骤S211、S212、S221以及S222,选取出后面每个分支的结点直至分类结束,或者直至所有True决策点样本总数和为变压器峰辨识中得到的气体组分峰的种数时,分类结束。
2.根据权利要求1所述的一种基于决策树算法的变压器色谱峰定性方法,其特征在于,所述步骤S20还包括在所述决策树形成后对所述决策树进行修剪。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福建工程学院,未经福建工程学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910851009.6/1.html,转载请声明来源钻瓜专利网。