[发明专利]IBD预警模型的训练、预警方法、系统、设备及介质在审
申请号: | 202211343270.3 | 申请日: | 2022-10-31 |
公开(公告)号: | CN115910218A | 公开(公告)日: | 2023-04-04 |
发明(设计)人: | 徐阳;伍星;石胜华;陈涛;邓世洲 | 申请(专利权)人: | 广东南芯医疗科技有限公司 |
主分类号: | G16B40/20 | 分类号: | G16B40/20;G16B30/00;G16H50/70;G06N3/08 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 黄涛 |
地址: | 510000 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | ibd 预警 模型 训练 方法 系统 设备 介质 | ||
本发明公开了IBD预警模型的训练、预警方法、系统、设备及介质,其中,训练方法包括获取肠道微生物测序数据集;对肠道微生物测序数据集进行生物信息学分析和特征编码,确定特征数据集;对特征数据集进行特征筛选处理,根据特征重要性和生物学先验知识去除特征数据集中的干扰特征,确定训练数据集;将训练数据集输入到IBD预警模型中进行训练,得到训练好的IBD预警模型,IBD预警模型包括全连接层和预先训练的降噪自编码器。该方法可以有效提高训练得到的IBD预警模型的准确性,有利于得到更为精确的IBD预警结果,可广泛应用于人工智能领域。
技术领域
本发明涉及人工智能技术领域,尤其是IBD预警模型的训练、预警方法、系统、设备及介质。
背景技术
炎症性肠病(IBD)是一种病因不明的慢性非特异性肠道炎症性疾病。该疾病对患者生活质量影响较大且治疗较为复杂,更有可能发展为直肠癌等更为严重的肠道疾病。若可以早期预警该疾病并知道预测对象饮食习惯,降低此类疾病的发生率,有较大的意义。目前,已有研究人员利用传统机器学习方法进行疾病的预测,如支持向量机(SVM)、梯度提升树(GBDT)、随机森林(RF)等方法预测IBD。但是传统的机器学习模型难以有效地利用大规模的数据,且准确率较低。综合上述,相关技术中存在的技术问题亟需得到解决。
发明内容
有鉴于此,本发明实施例提供一种IBD预警模型的训练、预警方法、系统、设备及介质,以实现提高IBD预警模型的准确率。
一方面,本发明提供了一种IBD预警模型的训练方法,所述方法包括:
获取肠道微生物测序数据集;
对所述肠道微生物测序数据集进行生物信息学分析和特征编码,确定特征数据集;
对所述特征数据集进行特征筛选处理,根据特征重要性和生物学先验知识去除所述特征数据集中的干扰特征,确定训练数据集;
将所述训练数据集输入到IBD预警模型中进行训练,得到训练好的IBD预警模型,所述IBD预警模型包括全连接层和预先训练的降噪自编码器。
可选地,所述获取肠道微生物测序数据集,包括:
通过文献阅读和数据库检索,查找各类肠道微生物测序数据;
对查找得到的各类肠道微生物测序数据进行数据筛选处理,去除离群数据,得到肠道微生物测序数据集。
可选地,所述对所述肠道微生物测序数据集进行生物信息学分析和特征编码,确定特征数据集,包括:
所述肠道微生物测序数据集包括第一数据集、第二数据集和第三数据集;
对所述第一数据集进行相似性序列聚类得到分类单元,基于分类单元进行物种注释,得到第一编码特征集;
对所述第二数据集进行相对定量计算,得到第二编码特征集;
对所述第三数据集进行特征序列计算,根据序列频率对计算得到的特征序列进行归一化处理,得到第三编码特征集;
根据所述第一编码特征集、所述第二编码特征集和所述第三编码特征集确定所述特征数据集。
可选地,所述将所述训练数据集输入到IBD预警模型中进行训练,包括:
将所述训练数据集输入到所述IBD预警模型;
冻结所述IBD预警模型中除训练层外的所有层的权重;
根据小批量梯度下降法对所述IBD预警模型的参数进行更新。
可选地,所述将所述训练数据集输入到IBD预警模型中进行训练之前,所述方法还包括预先训练降噪自编码器,具体包括:
获取预训练数据集;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东南芯医疗科技有限公司,未经广东南芯医疗科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211343270.3/2.html,转载请声明来源钻瓜专利网。