[发明专利]基于离散约束和封顶范数的肿瘤基因表达谱数据聚类方法有效
申请号: | 201810949097.9 | 申请日: | 2018-08-20 |
公开(公告)号: | CN109378039B | 公开(公告)日: | 2022-02-25 |
发明(设计)人: | 王雪松;刘健;程玉虎 | 申请(专利权)人: | 中国矿业大学 |
主分类号: | G16B25/10 | 分类号: | G16B25/10;G16B40/00;G06F17/15;G06F17/16;G06K9/62 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 楼高潮 |
地址: | 221116 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于离散约束和封顶范数的肿瘤基因表达谱数据聚类方法,步骤为:首先,将肿瘤基因表达谱数据表示为一个包含多个低秩子空间的低秩矩阵和一个噪声矩阵相加的形式;然后,引入离散约束方法和Schatten p范数对低秩矩阵进行约束,直接学习得到肿瘤基因表达谱数据的样本标签;最后,利用封顶范数对噪声矩阵进行优化,除去对原始肿瘤基因表达谱数据中的离群值得出最终的肿瘤基因表达谱数据聚类。本发明能完全去除离群值对肿瘤基因表达谱数据聚类的影响,从而提高肿瘤基因表达谱数据聚类的精度及鲁棒性。 | ||
搜索关键词: | 基于 离散 约束 封顶 范数 肿瘤 基因 表达 数据 方法 | ||
【主权项】:
1.一种基于离散约束和封顶范数的肿瘤基因表达谱数据聚类方法,其特征在于,具体步骤为:步骤A:采用主成分分析方法对原始肿瘤基因表达谱数据进行降维;步骤B:将降维后的肿瘤基因表达谱数据表示为一个包含多个低秩子空间的低秩矩阵和一个噪声矩阵相加的形式;步骤C:利用K均值方法初始化每个低秩子空间,得到每个低秩子空间的样本标签向量,并将其转换成离散约束对角矩阵形式;步骤D:利用低秩矩阵和离散约束方法表示每一个低秩子空间,并对每个低秩子空间采用Schatten p范数进行低秩逼近;步骤E:采用封顶范数对噪声矩阵进行约束;步骤F:利用增广拉格朗日乘子法对目标函数进行迭代优化,得到优化后的离散约束对角矩阵;步骤G:根据优化后的每个低秩子空间的离散约束对角矩阵得到最终的聚类标签矩阵。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国矿业大学,未经中国矿业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810949097.9/,转载请声明来源钻瓜专利网。