[发明专利]一种基于BPSO-KNN模型的关键lncRNA预测方法有效

专利信息
申请号: 201810288364.2 申请日: 2018-04-03
公开(公告)号: CN108537005B 公开(公告)日: 2019-04-02
发明(设计)人: 郑相涵;欧阳毅;叶少珍 申请(专利权)人: 福州大学
主分类号: G16B20/00 分类号: G16B20/00;G16B40/00
代理公司: 福州元创专利商标代理有限公司 35100 代理人: 蔡学俊
地址: 350108 福建省福*** 国省代码: 福建;35
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明涉及一种基于BPSO‑KNN模型的关键lncRNA预测方法,首先对lncRNA表达谱进行数据挖掘,依据不同疾病表达谱中lncRNA的表达比,分析相应lncRNA对不同类型疾病的影响;接着对LncRNA表达谱数据进行降维去燥、以及标准化处理;其次构建ML‑KNN预测结果评估模型来评价LncRNA粒子,并将评估值作为离散粒子群算法DPSO的适应度函数,用以指导DPSO中微粒的最优解;最后采用迭代法选择最终的LncRNA。本发明能够根据基因表达数据图谱,有效地预测出与癌症有关联的LncRNA。
搜索关键词: 表达谱 预测 离散粒子群算法 基因表达数据 标准化处理 适应度函数 评估模型 数据挖掘 预测结果 迭代法 有效地 最优解 疾病 构建 降维 粒子 图谱 癌症 关联 评估 分析
【主权项】:
1.一种基于BPSO‑KNN模型的关键lncRNA预测方法,其特征在于:包括以下步骤:步骤S1:对lncRNA表达谱进行数据挖掘,依据不同疾病表达谱中lncRNA的表达比,分析相应lncRNA对不同类型疾病的影响;步骤S2:对LncRNA表达谱数据进行降维去噪、以及标准化处理;步骤S3:构建ML‑KNN预测结果评估模型来评价LncRNA粒子,并将评估值作为离散粒子群算法DPSO的适应度函数,用以指导DPSO中微粒的最优解;步骤S4:采用迭代法选择最终的LncRNA;其中,所述步骤S2具体包括以下步骤:步骤S21:将LncRNA表达谱数据的原始数据按照50%、30%、20%的比例分成训练集、测试集与验证集;对LncRNA表达谱数据的原始数据进行特征提取得到初始LncRNA集合;步骤S22:采用信息增益率对初始LncRNA集合中的每个基因特征度量值进行评价,用以评判每个基因特征为系统带来的信息量大小;设定一阈值,评分低于该阈值的基因作为冗余基因去除,评分高于该阈值的基因子集则被保留用于分析或者二次过滤;其中,步骤S4具体包括以下步骤:步骤S41:采用Wrapper的方式对步骤S22中评分高于阈值的基因子集进行搜索,并将搜索结果LncRNA集合作为BPSO模型的搜索空间;步骤S42:初始微粒群体的速度与位置,每个微粒表示一个LncRNA粒子;步骤S43:赋予每个微粒和整个粒子群记忆能力,用以记忆迭代过程中的个体最优解和群体最优解;步骤S44:依照步骤S2中ML‑KNN预测结果评估模型返回的验证集合的准确率评价各个微粒,并不断更新BPSO模型里微粒的速度与位置进而寻找全局优化解。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201810288364.2/,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top