[发明专利]基于对比学习的单细胞数据聚类方法、装置、设备及介质在审
申请号: | 202210970095.4 | 申请日: | 2022-08-12 |
公开(公告)号: | CN115577273A | 公开(公告)日: | 2023-01-06 |
发明(设计)人: | 李君一;杜林林;韩睿;王轩;刘洋;漆舒汉;吴宇琳;姚霖;刘博;王亚东 | 申请(专利权)人: | 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) |
主分类号: | G06F18/23 | 分类号: | G06F18/23;G06F18/2415;G06F18/22;G16B20/30;G16B50/30;G16B40/00 |
代理公司: | 深圳市道勤知酷知识产权代理事务所(普通合伙) 44439 | 代理人: | 李兰兰 |
地址: | 518000 广东省深圳市南*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 对比 学习 单细胞 数据 方法 装置 设备 介质 | ||
1.一种基于对比学习的单细胞数据聚类方法,其特征在于,所述方法包括:
通过预先构建的特征提取模块确定待聚类单细胞数据的正视图对并提取所述正视图对的特征;
通过预先构建的对比学习模型将所述特征进行对比学习,获得所述待聚类单细胞数据的高阶表示,并对所述高阶表示进行聚类分析以获得所述待聚类单细胞数据的聚类分析结果。
2.根据权利要求1所述的方法,其特征在于,所述特征提取模块包括数据增强单元和动量编码器,所述通过预先构建的特征提取模块确定待聚类单细胞数据的正视图对并提取所述正视图对的特征包括:
通过数据增强单元对所述待聚类单细胞数据进行两次随机数据增强,生成正视图对;
通过所述动量编码器提取所述正视图对的特征。
3.根据权利要求2所述的方法,其特征在于,所述动量编码器包括第一编码器和第二编码器,所述第一编码器与所述第二编码器结构相同,参数不同;
所述通过所述动量编码器提取所述正视图对的特征包括:
通过所述第一编码器提取所述正视图对的第一特征;
通过所述第二编码器提取所述正视图对的第二特征。
4.根据权利要求1所述的方法,其特征在于,在所述通过预先构建的对比学习模型将所述特征进行对比学习,获得所述待聚类单细胞数据的高阶表示之前,还包括:
构建学习行空间特征的实例级对比学习模型;和
构建学习列空间特征的集群级对比学习模型。
5.根据权利要求4所述的方法,其特征在于,所述构建学习行空间特征的实例级对比学习模型包括:
通过多层感知机将行空间的单细胞样本数据的特征映射到潜在空间中;
计算所述单细胞样本数据的特征的余弦相似度;
基于所述余弦相似度确定所述特征的对比损失,并确定实例级对比学习模型的实例级损失函数,基于所述实例级损失函数确定所述实例级对比学习模型收敛。
6.根据权利要求4所述的方法,其特征在于,所述构建学习列空间特征的集群级对比学习模型包括:
通过多层感知机将列空间的单细胞样本的数据特征映射到M维空间中;
通过余弦相似度衡量两个单细胞样本数据间的相似度;
遍历所有集群确定集群级对比学习模型的集群级损失函数,基于所述集群级损失函数确定所述集群级对比学习模型收敛。
7.根据权利要求6所述的方法,其特征在于,所述构建学习列空间特征的集群级对比学习模型,还包括:
在所述集群级损失函数中添加集群分配概率交叉熵。
8.一种基于对比学习的单细胞数据聚类装置,其特征在于,所述装置包括:
特征提取模块,用于通过预先构建的特征提取模块确定待聚类单细胞数据的正视图对并提取所述正视图对的特征;
对比学习模块,用于通过预先构建的对比学习模型将所述特征进行对比学习,获得所述待聚类单细胞数据的高阶表示,并对所述高阶表示进行聚类分析以获得所述待聚类单细胞数据的聚类分析结果。
9.一种电子设备,其特征在于,包括存储器、处理器以及存储在所述存储器上的对比学习的单细胞数据聚类程序,所述对比学习的单细胞数据聚类程序被所述处理器运行时实现如权利要求1-7中任一项所述的方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有对比学习的单细胞数据聚类程序,所述对比学习的单细胞数据聚类程序被处理器运行时实现如权利要求1-7中任一项所述的方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院),未经哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210970095.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:数据频率回复电路
- 下一篇:一种自动化测试方法、终端设备以及计算机存储介质