[发明专利]挖掘癌症关键生物标记物的方法及装置在审
申请号: | 201910814283.6 | 申请日: | 2019-08-30 |
公开(公告)号: | CN110517786A | 公开(公告)日: | 2019-11-29 |
发明(设计)人: | 赵环宇;封晓娟;黎彤亮;庞超逸 | 申请(专利权)人: | 河北省科学院应用数学研究所 |
主分类号: | G16H50/70 | 分类号: | G16H50/70;G06N3/00 |
代理公司: | 13120 石家庄国为知识产权事务所 | 代理人: | 陈晓彦<国际申请>=<国际公布>=<进入 |
地址: | 050081 河北*** | 国省代码: | 河北;13 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 粒子群 生物标志物 癌症 粒子 生物标记物 患者样本 极值点 数据挖掘技术 分类模型 截止条件 粒子更新 数据集合 有效减少 冗余 挖掘 贝叶斯 初始化 预测 预设 全局 输出 重复 更新 申请 | ||
1.一种挖掘癌症关键生物标记物的方法,其特征在于,包括:
S101:获取至少一个癌症患者样本,每个癌症患者样本均包括多个生物标志物数据及对应的实际生存时间;
S102:将所有癌症患者样本作为粒子群中的粒子,并将癌症相关的生物标志物作为粒子的向量分量,对所述粒子群的各个粒子进行初始化;
S103:根据贝叶斯分类模型、所述粒子群中各个粒子的生物标志物数据及对应的实际生存时间,对各个粒子的速度及位置进行更新;
S104:重复S103,直至达到预设截止条件,输出所述粒子群当前的全局极值点,并将所述粒子群当前的全局极值点中选择的生物标志物作为预测生存时间的关键生物标志物。
2.如权利要求1所述的挖掘癌症关键生物标记物的方法,其特征在于,在S102之前,还包括:
对各个癌症患者样本中的生物标志物数据进行数据预处理,并对各个癌症患者样本的实际生存时间进行离散化处理。
3.如权利要求1所述的挖掘癌症关键生物标记物的方法,其特征在于,所述S103包括:
根据贝叶斯分类模型、所述粒子群中各个粒子的生物标志物数据及对应的实际生存时间,计算所述粒子群中各个粒子的适应度;
根据所述粒子群中各个粒子的适应度,对各个粒子的速度及位置进行更新。
4.如权利要求3所述的挖掘癌症关键生物标记物的方法,其特征在于,所述根据贝叶斯分类模型、所述粒子群中各个粒子的生物标志物数据及对应的实际生存时间,计算所述粒子群中各个粒子的适应度,包括:
将各个粒子对应的生物标志物数据分别输入所述贝叶斯分类模型,输出各个粒子的生存时间分类结果,并根据各个粒子的生存时间分类结果与对应的实际生存时间,得到各个粒子的分类精度;
根据各个粒子的分类精度,计算各个粒子的适应度。
5.如权利要求3所述的挖掘癌症关键生物标记物的方法,其特征在于,所述根据所述粒子群中各个粒子的适应度,对各个粒子的速度及位置进行更新,包括:
根据各个粒子的适应度,更新各个粒子当前的个体极值点及所述粒子群当前的全局极值点;
根据各个粒子当前的个体极值点及所述粒子群当前的全局极值点,对各个粒子的速度及位置进行更新。
6.如权利要求1至5任一项所述的挖掘癌症关键生物标记物的方法,其特征在于,所述重复S103,直至达到预设截止条件,输出所述粒子群当前的全局极值点,并将所述粒子群当前的全局极值点中选择的生物标志物作为预测生存时间的关键生物标志物,包括:
重复S103,直至迭代次数达到最大迭代次数,则输出所述粒子群当前的全局极值点;或,
重复S103,直至预测错误率小于预设错误率,则输出所述粒子群当前的全局极值点,所述预测错误率为通过所述全局极值点对所有癌症患者样本进行生存时间预测时的整体预测错误率。
7.一种挖掘癌症关键生物标记物的装置,其特征在于,包括:
样本获取模块,用于获取至少一个癌症患者样本,每个癌症患者样本均包括多个生物标志物数据及对应的实际生存时间;
粒子群初始化模块,用于将所有癌症患者样本作为粒子群中的粒子,并将癌症相关的生物标志物作为粒子的向量分量,对所述粒子群的各个粒子进行初始化;
粒子更新模块,用于根据贝叶斯分类模型、所述粒子群中各个粒子的生物标志物数据及对应的实际生存时间,对各个粒子的速度及位置进行更新;
关键生物标志物获取模块,用于重复粒子更新模块的计算过程,直至达到预设截止条件,输出所述粒子群当前的全局极值点,并将所述粒子群当前的全局极值点中选择的生物标志物作为预测生存时间的关键生物标志物。
8.如权利要求7所述的挖掘癌症关键生物标记物的装置,其特征在于,所述装置还包括:
数据预处理模块,用于对各个癌症患者样本中的生物标志物数据进行数据预处理,并对各个癌症患者样本的实际生存时间进行离散化处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河北省科学院应用数学研究所,未经河北省科学院应用数学研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910814283.6/1.html,转载请声明来源钻瓜专利网。