[发明专利]基于对抗自动编码器的单细胞RNA测序聚类方法在审
申请号: | 202010723087.0 | 申请日: | 2020-07-24 |
公开(公告)号: | CN111785329A | 公开(公告)日: | 2020-10-16 |
发明(设计)人: | 郭延明;武与伦;肖延东;老松杨 | 申请(专利权)人: | 中国人民解放军国防科技大学 |
主分类号: | G16B30/10 | 分类号: | G16B30/10;G16B30/20;G16B40/30;G06K9/62 |
代理公司: | 北京风雅颂专利代理有限公司 11403 | 代理人: | 李博瀚 |
地址: | 410003 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 对抗 自动 编码器 单细胞 rna 测序聚类 方法 | ||
1.一种基于对抗自动编码器的单细胞RNA测序聚类方法,其特征在于,包括:
利用基于深度技术自动编码器方法的零膨胀负二项分布特定损失函数对输入的数据进行数据重建,得到无噪音数据,并构建一个由编码器,中间隐藏层和解码器三部分构成的自动编码器框架,利用自动编码器的中间隐藏层中学习到隐藏层特征向量;
利用对抗自编码器对隐藏层特征向量的先验分布进行约束,将隐藏层特征向量的聚合后验与先验分布进行匹配;
使用负二项分布特定损失函数作为重建损失函数,并使用改进深度嵌入聚类进行聚类,计算聚类损失;
联合优化约束特征的重建损失和聚类损失,迭代地更新聚类标签分配。
2.根据权利要求1所述的基于对抗自动编码器的单细胞RNA测序聚类方法,其特征在于,所述利用基于深度技术自动编码器方法的零膨胀负二项式分布损失函数对输入的数据进行数据重建,得到无噪音数据包括,
通过负二项式分布的均值和离散度以及代表数据缺失概率的附加系数估算零膨胀负二项式分布损失函数:
ZINB(X|π,μ,θ)=πδ0(X)+(1-π)NB(X|μ,θ)
其中μ表示负二项式分布的均值,θ表示离散度,π表示数据缺失概率的附加系数,ZINB表示零膨胀负二项式分布损失函数;
将零膨胀负二项式分布损失函数作为重建损失函数对输入的数据进行数据重建,得到无噪音数据。
3.根据权利要求1所述的基于对抗自动编码器的单细胞RNA测序聚类方法,其特征在于,所述利用对抗自编码器对隐藏层特征向量的先验分布进行约束包括:
在自动编码器的中间隐藏层顶部添加一个判别器,将自动编码器修改为对抗自编码器;
将编码器函数和解码器函数分别定义为和其中Z表示隐藏层的特征,权重WE和WD分别是编码器和解码器中的待学习参数;
将自动编码器中间隐藏层的潜在特征和来自先验分布的一组相同维度大小的真实样本输入判别器,利用二进制交叉熵损失来训练和更新参数,其中Ld代表判别器的损失函数:
将自动编码器作为生成器进行训练,以混淆判别器,并让判别器判断编码器生成的输入样本为真实样本;
其中Lg代表判别器的损失函数,zi表示真实样本,D表示判别器,Si表示自动编码器中间隐藏层的潜在特征。
4.根据权利要求3所述的基于对抗自动编码器的单细胞RNA测序聚类方法,其特征在于,在利用二进制交叉熵损失来训练和更新参数之前,所述方法还包括:
将零均值高斯随机噪声添加到编码器的每一层,使模型更健壮。
5.根据权利要求1所述的基于对抗自动编码器的单细胞RNA测序聚类方法,其特征在于,所述使用负二项分布特定损失函数作为重建损失函数,并使用IDEC进行聚类,计算聚类损失包括:
将解码器的最后一层替换为三个独立的全连接层,且三个独立的全连接层的维度与输入数据相同,解码器的架构为:
De=GWD(H)
Φ=sigmoid(WπDe)
Θ=exp(WθDe)
其中,H表示瓶颈层的输出,WM,Wπ和Wθ分别代表最后三个全连接层中的待学习参数,尺度因子sf是一个独立的生物学变量,由原始数据的库大小和细胞中位数计算得出;
ZINB分布的重建损失函数是ZINB分布的负对数变换
Lr=-log(ZINB(X|π,μ,θ))
在辅助目标分布P和样本特征中软聚类标签的分布Q之间的KL散度计算得到聚类损失,
6.根据权利要求1所述的基于对抗自动编码器的单细胞RNA测序聚类方法,其特征在于,所述包括:
联合优化约束特征的重建损失和聚类损失,迭代地更新聚类标签分配,
模型的目标函数定义为
L1=Lr+Lg
相对于聚类中心μj和隐藏层特征样本zi的Lc的梯度计算如下
在聚类过程中,聚类中心μj通过以下方式更新
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科技大学,未经中国人民解放军国防科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010723087.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:可自动调节规格的穿刺器
- 下一篇:一种基于深度学习的探地雷达智能反演方法