[发明专利]一种基于集成学习与改变决策阈值的化验数据校验方法在审
申请号: | 202010612164.5 | 申请日: | 2020-06-29 |
公开(公告)号: | CN111858568A | 公开(公告)日: | 2020-10-30 |
发明(设计)人: | 赵杰;翟运开;叶明;石金铭;陈昊天;卢耀恩;张旭;李明原 | 申请(专利权)人: | 郑州大学第一附属医院 |
主分类号: | G06F16/215 | 分类号: | G06F16/215;G06F16/2458;G06K9/62;G06N20/20 |
代理公司: | 常州佰业腾飞专利代理事务所(普通合伙) 32231 | 代理人: | 张励 |
地址: | 450001 河*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 集成 学习 改变 决策 阈值 化验 数据 校验 方法 | ||
1.一种基于集成学习与改变决策阈值的化验数据校验方法,其特征在于:包括如下步骤:
步骤1:建立数个远程终端和中心服务器,所有远程终端均通过互联网与中心服务器通信;
在远程终端中建立数据采集模块、数据清洗模块和分类模块;
在中心服务器中建立对比数据集和多指标评价模块;
步骤2:远程终端通过数据采集模块获取体液化验数据,建立体液数据集,并在数据清洗模块中对体液数据集中的数据进行清洗,包括如下步骤:
步骤S1:对体液化验数据中的缺失值和异常值进行处理,剔除异常数据,得到预处理数据集;
步骤S2:通过均值方差归一化将预处理数据集中的数据转换为同一水平下的数据,得到预处理后数据集;
步骤S3:将预处理后数据集中的70%的数据划分为训练集,再将其中30%的数据划分为测试集;
步骤3:分类模块选择KNN、决策树、支持向量机和逻辑回归算法四种不同的单分类器作为基分类器,组合得到一个集成分类器;
步骤4:远程终端读取中心服务中的对比数据集;
步骤5:分类模块计算基分类器权重,包括如下步骤:
步骤S4:对训练集中的样本通过FCM模糊聚类算法进行聚类划分为两类样本;
步骤S5:基分类器分别在这两类样本上进行分类,通过与对比数据集中的实际标签进行对比,得到每个基分类器的分类错误率e;
步骤S6:根据公式计算得到每个基分类器的权重w;
步骤6:分类模块计算测试集中每个测试样本到每个聚类中心的欧氏距离,将欧氏距离的倒数作为每个测试样本与步骤S4中得到的所述两类样本的相似度S,将相似度S作为测试样本的相似度值;
步骤7:分类模块通过以下公式计算测试样本i的专属权重Wi
Wi=相似度S×权重w;
对每一个测试样本进行计算,得到每一个测试样本相对于每一个个基分类器的专属权重Wi;
步骤8:测试样本在每个基分类器上都会得到一个分类概率p,将测试样本的专属权重Wi和分类概率p相乘,得到将测试样本分类为步骤S4中得到的所述两类样本的最终概率P1和P0;
设定所述两类样本分别为1类样本和0类样本,其包含的样本数分别为N1和N0,根据样本数N1和N0,改变决策阈值:当满足(P1÷P0)(N1÷N0)时,将测试样本预测为1类样本;否则为0类样本;
步骤9:远程终端将步骤8得到的分类的结果和体液化验数据打包发送给中心服务器,中心服务器存储分类的结果,并通过多指标评价模块,根据准确率ACC、精准率Precision、召回率Recall、F1-score、AUC、灵敏度TPR和特异度TNR多个不同的指标,从多角度评价分类的结果的准确性。
2.如权利要求1所述的一种基于集成学习与改变决策阈值的化验数据校验方法,其特征在于:所述远程终端为平板电脑、电脑终端或智能手机。
3.如权利要求1所述的一种基于集成学习与改变决策阈值的化验数据校验方法,其特征在于:所述体液化验数据由化验中心设备获取,并通过移动网络或WIFI发送给所述远程终端。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州大学第一附属医院,未经郑州大学第一附属医院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010612164.5/1.html,转载请声明来源钻瓜专利网。