[发明专利]一种基于LightGBM算法的食源性致病菌分类方法在审

专利信息
申请号: 202210226116.1 申请日: 2022-03-08
公开(公告)号: CN114663722A 公开(公告)日: 2022-06-24
发明(设计)人: 曾万聃;王成 申请(专利权)人: 上海应用技术大学
主分类号: G06V10/774 分类号: G06V10/774;G06V10/77;G06V10/764;G06K9/62;G01N21/65
代理公司: 上海汉声知识产权代理有限公司 31236 代理人: 黄超宇;胡晶
地址: 200235 上海*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 lightgbm 算法 食源性 致病菌 分类 方法
【说明书】:

发明公开了一种基于LightGBM算法的食源性致病菌分类方法,包括步骤1:光谱背景拟合和数据预处理;步骤2:食源性病菌拉曼光谱数据预处理;步骤3:Light GBM分类模型,计算初始梯度值,初始值设为零,建立树并设置树的深度不超过100层。本发明通过对LightGBM集成算法建立一种分类模型使其对食源性致病菌光谱数据进行分析分类,能提高食品安全检测的效率,保障人民的食品卫生安全。

技术领域

本发明涉及拉曼光谱、LightGBM集成算法和机器学习领域,特别涉及一种基于LightGBM算法的食源性致病菌分类方法。

背景技术

据WHO最新研究表明,全球每年因食品安全问题而感染食源性疾病的患者达数亿,因而采取一定检测方法来判别食源性疾病,传统的方法有培养鉴定技术、分子检测技术、免疫学检测技术、生物传感器等。这些传统的生物方法操作繁琐,灵敏度低,特异性低。使用表面增强的拉曼散射生物传感技术是目前研究食源性致病菌检测方法的重点,将生物工程与机器学习技术结合能有效快速地检测食源性病原,具有准确率高、检测速度快、消耗量低的特点。常规的机器学习分类方法有SVM、logistic分类、boost集成算法,随机森林等,但是这些方法提出较早,准确率相比最新的学习算法较低。

因此本发明使用微软最新研发的基于决策树算法的轻量级梯度提升算法作为食源性致病菌分类模型的算法,它将单边梯度采样算法(GOSS)和EFB算法相结合,是为了解决XGboost算法中的缺点。Light GBM算法具有精确度更高、处理大规模数据、更快的训练速度和更高的效率等特点,能显著提升病菌的拉曼光谱分类准确率和效率。

发明内容

为了克服现有技术中的不足,本发明提供一种基于LightGBM算法的食源性致病菌分类方法,解决传统的食源性致病菌检测时间长,准确率低的问题。

为了达到上述发明目的,解决其技术问题所采用的技术方案如下:

一种基于LightGBM算法的食源性致病菌分类方法,包括以下步骤:

步骤1:光谱背景拟合和数据预处理;

步骤2:食源性病菌拉曼光谱数据预处理;

步骤3:Light GBM分类模型,计算初始梯度值,初始值设为零,建立树并设置树的深度不超过100层。

进一步的,步骤1包括以下内容:

步骤1.1:对原始数据进行归一化,采用波长大于532nm的激光激发被测物质,降低荧光干扰的概率,将去除荧光背景的光谱截断为偏移600至2000的区间内,绘制光谱图片;

步骤1.2:再采取最大最小标准化的方法对原始数据进行归一化,公式如下:

其中,Max是数据的最大值,Min是数据的最小值,x’是归一化后的样本数值;

再使用SG方法对光谱中尖锐的峰值平滑处理;

步骤1.3:使用分段线性拟合法对光谱进行基线校正,解决拉曼光谱基线漂移现象,采用移动窗口结合最小二乘法对大肠杆菌和布鲁氏菌的数据噪声进行抑制。

进一步的,步骤2包括以下内容:

步骤2.1:对降噪后的光谱数据使用PCA降维,选取数据集中的主特征;

步骤2.2:将数据集分成训练集和测试集,其中30%的数据集用来训练模型,70%的数据集用来测试模型的准确率,以便提高模型的健壮性和准确性。

进一步的,步骤3包括以下内容:

步骤3.1:计算直方图,从直方图中选择最大收益的特征分裂,建立根结点,重复选取最佳分裂结点,分裂特征,直到叶子结点数量限制或者叶子结点不能分割为止;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海应用技术大学,未经上海应用技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210226116.1/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top