[发明专利]一种基于BPSO-KNN模型的关键lncRNA预测方法有效
申请号: | 201810288364.2 | 申请日: | 2018-04-03 |
公开(公告)号: | CN108537005B | 公开(公告)日: | 2019-04-02 |
发明(设计)人: | 郑相涵;欧阳毅;叶少珍 | 申请(专利权)人: | 福州大学 |
主分类号: | G16B20/00 | 分类号: | G16B20/00;G16B40/00 |
代理公司: | 福州元创专利商标代理有限公司 35100 | 代理人: | 蔡学俊 |
地址: | 350108 福建省福*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于BPSO‑KNN模型的关键lncRNA预测方法,首先对lncRNA表达谱进行数据挖掘,依据不同疾病表达谱中lncRNA的表达比,分析相应lncRNA对不同类型疾病的影响;接着对LncRNA表达谱数据进行降维去燥、以及标准化处理;其次构建ML‑KNN预测结果评估模型来评价LncRNA粒子,并将评估值作为离散粒子群算法DPSO的适应度函数,用以指导DPSO中微粒的最优解;最后采用迭代法选择最终的LncRNA。本发明能够根据基因表达数据图谱,有效地预测出与癌症有关联的LncRNA。 | ||
搜索关键词: | 表达谱 预测 离散粒子群算法 基因表达数据 标准化处理 适应度函数 评估模型 数据挖掘 预测结果 迭代法 有效地 最优解 疾病 构建 降维 粒子 图谱 癌症 关联 评估 分析 | ||
【主权项】:
1.一种基于BPSO‑KNN模型的关键lncRNA预测方法,其特征在于:包括以下步骤:步骤S1:对lncRNA表达谱进行数据挖掘,依据不同疾病表达谱中lncRNA的表达比,分析相应lncRNA对不同类型疾病的影响;步骤S2:对LncRNA表达谱数据进行降维去噪、以及标准化处理;步骤S3:构建ML‑KNN预测结果评估模型来评价LncRNA粒子,并将评估值作为离散粒子群算法DPSO的适应度函数,用以指导DPSO中微粒的最优解;步骤S4:采用迭代法选择最终的LncRNA;其中,所述步骤S2具体包括以下步骤:步骤S21:将LncRNA表达谱数据的原始数据按照50%、30%、20%的比例分成训练集、测试集与验证集;对LncRNA表达谱数据的原始数据进行特征提取得到初始LncRNA集合;步骤S22:采用信息增益率对初始LncRNA集合中的每个基因特征度量值进行评价,用以评判每个基因特征为系统带来的信息量大小;设定一阈值,评分低于该阈值的基因作为冗余基因去除,评分高于该阈值的基因子集则被保留用于分析或者二次过滤;其中,步骤S4具体包括以下步骤:步骤S41:采用Wrapper的方式对步骤S22中评分高于阈值的基因子集进行搜索,并将搜索结果LncRNA集合作为BPSO模型的搜索空间;步骤S42:初始微粒群体的速度与位置,每个微粒表示一个LncRNA粒子;步骤S43:赋予每个微粒和整个粒子群记忆能力,用以记忆迭代过程中的个体最优解和群体最优解;步骤S44:依照步骤S2中ML‑KNN预测结果评估模型返回的验证集合的准确率评价各个微粒,并不断更新BPSO模型里微粒的速度与位置进而寻找全局优化解。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810288364.2/,转载请声明来源钻瓜专利网。