[发明专利]融合自学习和低秩表示的基因表达数据癌症分类方法有效

专利信息
申请号: 201611207518.8 申请日: 2016-12-23
公开(公告)号: CN107526946B 公开(公告)日: 2021-07-06
发明(设计)人: 於东军;夏春秋;韩珂 申请(专利权)人: 南京理工大学
主分类号: G16B40/00 分类号: G16B40/00;G16B25/10
代理公司: 南京理工大学专利中心 32203 代理人: 王玮
地址: 210094 *** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种融合自学习和低秩表示的基因表达数据癌症分类方法,包括:步骤1、对于给定的癌症基因表达数据集,将数据合并构建数据矩阵,并作归一化处理;步骤2、对于得到的数据矩阵,利用低秩表达方法进行分解,得到一个低秩矩阵和一个稀疏矩阵;步骤3、利用训练集的标签信息,在低秩矩阵和稀疏矩阵上分别计算每个类别的初始点;步骤4、分别在低秩矩阵和稀疏矩阵上使用一种无监督聚类方法,分别获得基于低秩矩阵和稀疏矩阵的预测结果;步骤5、对比两个预测结果,若无预测相同的样本或达到最大迭代次数,输出基于低秩表达矩阵的预测结果;否则,将预测相同的样本移除测试集并加入训练集,回到步骤3。利用本发明可在利用少量标注样本的情况下提高预测精度,减少了标注样本中的时间和人力成本。
搜索关键词: 融合 自学习 表示 基因 表达 数据 癌症 分类 方法
【主权项】:
一种融合自学习和低秩表示的基因表达数据癌症分类方法,其特征在于包括以下步骤:步骤1、对于给定癌症基因表达数据集,其中有标签数据的集合为训练集,无标签数据集合为测试集;将数据合并构建数据矩阵X,并作归一化处理;步骤2、对于得到的数据矩阵,利用低秩表达方法进行分解,得到一个低秩矩阵Z和一个稀疏矩阵E;步骤3、利用训练集的标签信息,在低秩矩阵Z和稀疏矩阵E上分别计算每个类别i的初始点坐标p(i);步骤4、分别在低秩矩阵Z和稀疏矩阵E上使用一种无监督聚类方法,分别获得基于低秩矩阵Z和稀疏矩阵E的预测结果lZ和lE;步骤5、对比两个预测结果lZ和lE,若无预测相同的样本或达到最大迭代次数,输出基于低秩表达矩阵的预测结果lZ;否则,将预测相同的样本移除测试集并加入训练集,返回步骤3。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京理工大学,未经南京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201611207518.8/,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top