[发明专利]基于标记基因和混合核函数SVM的结直肠癌预测方法和装置在审
申请号: | 201810387723.X | 申请日: | 2018-04-26 |
公开(公告)号: | CN108615555A | 公开(公告)日: | 2018-10-02 |
发明(设计)人: | 刘弘;赵丹丹;郑元杰;何演林;陆佃杰;吕晨 | 申请(专利权)人: | 山东师范大学 |
主分类号: | G16H50/20 | 分类号: | G16H50/20;G16H50/70 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 黄海丽 |
地址: | 250014 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 结直肠癌 支持向量机 核函数 方法和装置 标记基因 样本数据 支持向量机分类器 预处理 多项式核函数 高斯核函数 线性核函数 特征基因 预测 构建 两组 分类 疾病 优化 健康 | ||
本发明公开了一种用于结直肠癌预测的支持向量机分类器构造方法和装置,所述方法包括:获取健康和结直肠癌样本数据并进行预处理;基于两组样本数据确定与疾病相关的特征基因;利用高斯核函数、多项式核函数和线性核函数构建混合核函数支持向量机;对混合核函数支持向量机的参数进行优化。本发明构造的支持向量机更加适应于基于标记基因执行分类,并且能够节省结直肠癌判断的时间。
技术领域
本发明属于疾病辅助预测领域,尤其涉及了一种基于标记基因和混合核函数SVM的结直肠癌预测方法和装置。
背景技术
结直肠癌是最常见的恶性肿瘤之一,全球每年约有120万人罹患结直肠癌,死于该病的患者高达60万人,不仅造成了巨大的经济损失,而且对人类的健康造成了严重威胁。早期对该疾病进行筛查是成功治疗和患者存活的关键,也是当前公共卫生领域面临的一大挑战。传统的结直肠癌诊断方法有X线检查、血清癌胚抗原(CEA)检查、内镜检查等,这些方法对结直肠癌的诊断起到了至关重要的作用,但是这些方法的患者依从性低,而且需要依据医生的经验对检查结果进行判定,难以保证诊断的准确性,因此需要寻找患者依从性高,预测准确率高的方法。
针对以上结直肠癌诊断方法的局限性,融入机器学习算法的预测模型逐步成为研究的热点。目前,利用机器学习算法对结直肠癌进行预测主要存在以下几个问题:(1)疾病特征因素冗余(2)不能正确选取特征数量(3)不能正确选择合适分类器。
针对机器学习算法在结直肠癌预测中存在的局限性,我们的工作主要有两点:第一,利用合适的算法选取最佳的疾病特征;第二,对于传统的疾病预测算法进行优化改进,提高疾病预测的准确性。本发明主要涉及到两个算法:最小冗余最大相关(mRMR)算法和混合核函数的支持向量(MKF-SVM)算法。其中mRMR算法用于疾病特征的选择,该算法可以减少冗余特征,有利于提高模型预测精度;MKF-SVM算法主要用于构建分类器,进行疾病预测。通过这两种算法相集成的方法,进而达到提高结直肠癌预测准确率的效果。
在之前的工作中,我们已经发现,结直肠癌的患病情况与患者的年龄,性别,饮食习惯,家族遗传以及环境和肠道菌群组成等有关,这些因素对结直肠癌的诊断起到了重要作用。近些年来,许多研究者开始着手于基因表达差异来分析结直肠癌,通过对比健康人群与结直肠癌患者的基因表达情况来寻找患者的标记基因,并将其作为判断是否患病的重要指标。在结直肠癌患病的不同阶段(Stage I-IV),标记基因的表达情况存在明显的差异(p<0.05),所以将标记基因作为预测模型的输入有助于提高模型的预测精度。
支持向量机(SVM)是一种经典的预测算法,被广泛应用于社交、交通等不同方面,并且得到很好的预测效果。该算法主要有两类核函数:局部核函数和全局核函数。其中局部核函数在局部特性上表现优越,具有较强的内插能力;全局核函数在全局特性上表现优越,具有较强的外推能力,合理的选择核函数的类型能够有效的提高算法的分类性能。然而,在解决实际问题时,人们的通常做法是根据专家的先验知识预先选定单一的核函数,但这种方法往往导致选取的核函数只具有单一性质,不能很好的解决问题。
因此,如何根据选定的标记基因特征来构建用于预测结直肠癌预测的模型,是本领域技术人员目前需要迫切解决的技术问题。
发明内容
为克服上述现有技术的不足,本发明提供了一种用于结直肠癌预测的支持向量机分类器构造方法和装置,所述方法包括:获取健康和结直肠癌样本数据并进行预处理;基于两组样本数据确定与疾病相关的特征基因;利用高斯核函数、多项式核函数和线性核函数构建混合核函数支持向量机;对混合核函数支持向量机的参数进行优化。本发明构造的支持向量机更加适应于基于标记基因执行分类,并且能够节省结直肠癌判断的时间。
为实现上述目的,本发明采用如下技术方案:
一种用于结直肠癌预测的支持向量机分类器构造方法,包括以下步骤:
获取健康和结直肠癌样本数据并进行预处理;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东师范大学,未经山东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810387723.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种远程超声诊断系统
- 下一篇:一种基于自组织映射方法的骨关节炎疾病检测系统