[发明专利]一种微液滴数据分析方法及系统有效
申请号: | 201810600465.9 | 申请日: | 2018-06-12 |
公开(公告)号: | CN109002833B | 公开(公告)日: | 2019-08-27 |
发明(设计)人: | 马旭;曹宗富;蔡瑞琨;路建波 | 申请(专利权)人: | 国家卫生健康委科学技术研究所 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京市万慧达律师事务所 11111 | 代理人: | 黄玉东 |
地址: | 100081 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信号簇 微液滴 均值算法 数据分析 样本数据 噪音信号 校正 样本 数据分析结果 聚类分析 分布图 聚类 算法 优化 输出 返回 分类 | ||
1.一种微液滴数据分析方法,其特征在于,包括:
步骤S1:从微液滴样本中获取m个样本数据,m>>3;
步骤S2:采用K-均值算法对m个样本数据进行初步分类,得到Vic信号簇、fam信号簇以及噪音信号簇;
步骤S3:计算所述fam信号簇与所述Vic信号簇的比值结果,当所述比值结果属于阈值范围内时,执行步骤S5,否则,执行步骤S4;
步骤S4:当所述比值结果小于阈值范围时通过K-均值算法对所述Vic信号簇优化校正,或者,当所述比值结果大于阈值范围时通过DBSCAN算法对所述fam信号簇优化校正,返回步骤S3;
步骤S5:输出Vic信号簇、fam信号簇和噪音信号簇的聚类分布图,得到所述微液滴样本的数据分析结果。
2.根据权利要求1所述的方法,其特征在于,所述步骤S2,采用K-均值算法对m个样本数据进行初步分类,得到Vic信号簇、fam信号簇以及噪音信号簇的方法包括:
构建坐标轴,所述坐标轴包括m个样本数据;
随机选取3个样本数据,分别标记第一中心点、第二中心点和第三中心点;
分别计算各样本数据分别至各中心点的相异度值,得到初次相异度值集合;
基于所述初次相异度值集合对未标记样本数据进行聚类,分别得到初次Vic信号簇、初次fam信号簇和初次噪音信号簇,并分别重新计算初次Vic信号簇的中心点、初次fam信号簇的中心点和初次噪音信号簇的中心点;
分别计算各样本数据与重新确定的3个中心点的相异度值,得到第2次相异度值集合;
基于第2次相异度值集合对各样本数据进行聚类,对应得到2次Vic信号簇、2次fam信号簇和2次噪音信号簇;
判断第2次聚类结果是否与初次聚类结果一致,若是,将第2次聚类结果输出;否则,执行下述步骤,
再次计算2次Vic信号簇的中心点、2次fam信号簇的中心点和2次噪音信号簇的中心点;
分别计算各样本数据与上次确定的3个中心点的相异度值,得到第n次的聚类结果,n≥3,直至第n次的聚类结果与第n-1次的聚类结果一致,将第n次的聚类结果输出。
3.根据权利要求2所述的方法,其特征在于,n次Vic信号簇的中心点、n次fam信号簇的中心点和n次噪音信号簇的中心点的计算方法分别为:
统计n-1次Vic信号簇中的全部样本数据并计算其坐标均值,得到n次Vic信号簇的中心点;
统计n-1次fam信号簇中的全部样本数据并计算其坐标均值,得到n次fam信号簇的中心点;
统计n-1次噪音信号簇中的全部样本数据并计算其坐标均值,得到n次噪音信号簇的中心点。
4.根据权利要求2所述的方法,其特征在于,上述基于第n次相异度值集合对各样本数据聚类,对应得到n次Vic信号簇、n次fam信号簇和n次噪音信号簇的方法包括:
从所述第n次相异度值集合中,依次筛选各样本数据对应的最小相异度值;
根据所述最小相异度值将各样本数据对应与n次Vic信号簇的中心点、n次fam信号簇的中心点和n次噪音信号簇的中心点聚类,得到n次Vic信号簇、n次Vic信号簇和n次噪音信号簇。
5.根据权利要求2所述的方法,其特征在于,所述相异度值的计算方法为:
采用余弦距离公式计算两点坐标余弦值cosθ,所述两点坐标对应为样本数据的坐标,以及任一中心点的坐标;
应用公式|1-cosθ|求得两点坐标的相异度值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家卫生健康委科学技术研究所,未经国家卫生健康委科学技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810600465.9/1.html,转载请声明来源钻瓜专利网。