[发明专利]一种基于机器学习的血常规样本差值核查方法在审
申请号: | 202011473586.5 | 申请日: | 2021-01-19 |
公开(公告)号: | CN113555124A | 公开(公告)日: | 2021-10-26 |
发明(设计)人: | 陈超;宋彪;王哲 | 申请(专利权)人: | 内蒙古卫数数据科技有限公司 |
主分类号: | G16H50/70 | 分类号: | G16H50/70;G06N20/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 010010 内蒙古自治区呼和浩特市新城*** | 国省代码: | 内蒙古;15 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 机器 学习 血常规 样本 差值 核查 方法 | ||
1.一种基于机器学习分类算法的血常规样本差值核验方法,其特征在于:将两次的样本、差值作为模型分类依据,实现对样本质量的识别,其中被预测为异常的样本可归结为配对错误、样本污染、异常生物变异三种情况。
2.根据权利要求1所述的基于机器学习算法分类的血常规差值质量识别方法,其特征在于:所述检验样本数据为医院的实验室血常规各项检验指标数据。
3.所述样本的数据预处理过程包括数据区域转置、数据缺失值填补和变量筛选。
4.根据权利要求2所述的基于机器学习分类算法的血常规样本识别方法,其特征在于:将合适的样本数据配对操作,同一个人前后两次的差值按正常样本标记,随机搭配的两个人各自前后的样本差值按异常样本标记。
5.根据权利要求3所述的基于机器学习分类算法的血常规样本识别方法,其特征在于:对血常规下的各分类指标信息熵权,依据权重对样本重塑。
6.使得处理后的负荷数据处在统一的阈值范围内。
7.根据权利要求1所述的基于机器学习分类算法的血常规样本识别方法,其特征在于:建立机器学习分类器模型,依据二分类策略实现数据的分类。
8.可采用的算法有逻辑回归分类、KNN分类、云计算分类、贝叶斯分类、决策树、支持向量机分类、神经网络分类、深度神经网络分类等,依据二分类策略实现数据的分类。
9.根据权利要求4所述的基于机器学习分类算法的血常规样本识别方法,其特征在于:按照8:2的比例划分训练组与实验组,训练组用于机器学习分类模型的训练,实验组用于检测模型的辨别能力。
10.根据权利要求5所述的基于机器学习分类算法的血常规样本识别方法,其特征在于:将训练组输入到模型中进行训练;在每次的训练结束后进行交叉验证,为评估统计分析、机器学习算法对独立于训练数据的数据集的泛化能力,避免过拟合问题。
11.交叉验证一般要尽量满足两点:训练集的比例要足够多,一般大于一半;训练集和测试集要均匀抽样。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于内蒙古卫数数据科技有限公司,未经内蒙古卫数数据科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011473586.5/1.html,转载请声明来源钻瓜专利网。