[发明专利]基于数据流聚类的癌症亚型精准发现与演化分析方法有效
申请号: | 201710355340.X | 申请日: | 2017-05-19 |
公开(公告)号: | CN107301328B | 公开(公告)日: | 2021-04-06 |
发明(设计)人: | 陈晋音;郑海斌;林翔;熊晖;李南;应时彦 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G16B40/00 | 分类号: | G16B40/00;G16B25/00;G06K9/62 |
代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
地址: | 310014 浙江省杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于数据流聚类的癌症亚型精准发现与演化分析方法,包括以下步骤:(a)基因表达数据流的初始化;(b)基因表达数据流在线实时聚类,将每个到达的数据点投入与之相对应的网格单元中,并在线维护网格;到达指定时间节点时,根据网格的密度信息对稀疏网格进行删除;(c)基因表达数据流离线精准聚类,将网格视作自带密度信息的虚拟数据点,采用基于密度‑距离分布的聚类方法对这些虚拟的数据点进行聚类,根据被确定的聚类中心点的密度信息对其他数据点进行快速的聚类划分,最终输出聚类结果;(d)类簇演化迁移分析。本发明提供一种精度较高的基于数据流聚类的癌症亚型精准发现与演化分析方法。 | ||
搜索关键词: | 基于 数据流 癌症 精准 发现 演化 分析 方法 | ||
【主权项】:
一种基于数据流聚类的癌症亚型精准发现与演化分析方法,其特征在于:包括以下步骤:(a)基因表达数据流的初始化对数据流的维度信息进行分析,并确定相似度距离计算方法;建立基因数据流对象的网格单元,并将数据按窗口投入网格中实现初始化;构建非均匀衰减模型,确定在线过程中数据流的非均匀衰减参数和网格密度信息更新方法;(b)基因表达数据流在线实时聚类将每个到达的数据点投入与之相对应的网格单元中,并在线维护网格;到达指定时间节点时,根据网格的密度信息对稀疏网格进行删除;(c)基因表达数据流离线精准聚类将网格视作自带密度信息的虚拟数据点,采用基于密度‑距离分布的聚类方法对这些虚拟的数据点进行聚类,根据被确定的聚类中心点的密度信息对其他数据点进行快速的聚类划分,最终输出聚类结果;(d)类簇演化迁移分析将不同时间节点下的离线聚类结果按时间顺序进行保存,用以分析各个类簇随时间的变化情况,即基因表达数据的演化分析。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710355340.X/,转载请声明来源钻瓜专利网。