[发明专利]一种基于深度混合网络的单细胞转录组缺失值填补方法有效

专利信息
申请号: 201911072613.5 申请日: 2019-11-05
公开(公告)号: CN110957009B 公开(公告)日: 2023-05-12
发明(设计)人: 何尧;谢志;袁皓 申请(专利权)人: 中山大学中山眼科中心
主分类号: G16B40/00 分类号: G16B40/00
代理公司: 广州粤高专利商标代理有限公司 44102 代理人: 林丽明
地址: 510060 广*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 深度 混合 网络 单细胞 转录 缺失 填补 方法
【权利要求书】:

1.一种基于深度混合网络的单细胞转录组缺失值填补方法,其特征在于,包括以下步骤:

S1:对单细胞测序并进行预处理,得到表达矩阵;

S2:将表达矩阵进行标准化处理得到初始表达矩阵;

S3:构建基于深度学习的混合模型,包括自编码器和循环神经网络两部分;

S4:将初始表达矩阵输入自编码器进行降维处理,得到一个降维的特征矩阵和一个重建的表达矩阵;

S5:将降维的特征矩阵输入循环神经网络,预测所有基因的表达值,得到对应的预测表达矩阵;

S6:将步骤S5得到的预测表达矩阵作为自编码器的输入,重复循环步骤S4、步骤S5,直至到达预设的循环步数,得到多个预测表达矩阵;

S7:计算每一次循环的权重,将多个预测表达矩阵按照对应的权重进行加权平均,输出的结果作为混合模型的填补输出,完成对单细胞转录组缺失值的填补;

所述步骤S2具体为:

表达矩阵根据每个细胞的文库大小ls进行标准化,消除文库大小的影响,其中,对于细胞c的基因表达值向量Cc的标准化的公式为:

其中,sf表示所有细胞标准化后的文库大小,对表达矩阵内所有细胞进行标准化操作,以每个基因的最大表达值为标准,调整取值范围到0-1;

所述混合模型的应用过程中,采用非阻塞多进程分块随机读取数据的方法将单细胞数据输入混合模型;具体过程为:

输入单细胞数据文件的存储地址,该文件满足存取矩阵并进行分块读取的任意类型;

根据存储地址,读取文件所存储的单细胞转录组矩阵的维度信息,包括细胞数目和基因数目,并输入对应的细胞名称,基因名称;

将所有细胞按顺序划分成多个数据簇,并为每个数据簇标记上序号,所有簇序号作为一个序号池;

根据序号池建立一个副本,每次不放回地随机抽取一定个数的簇序号,抽取出数据集合,若该副本数据抽取完毕则重新建立副本进行抽取;

程序启动处理子进程对抽取得到的数据集合进行处理;子进程的数目为任意个,每个启动的子进程的启动顺序及处理内容会被记录,确保处理结果准确地发送至准确的混合模型输入管道中。

2.根据权利要求1所述的一种基于深度混合网络的单细胞转录组缺失值填补方法,其特征在于,所述步骤S1具体包括以下步骤:

S11:采用现有的建库方法获取处理后细胞,进行测序得到序列数据,文件格式,如Fastq;

S12:利用映射软件,如Tophat2,对序列数据进行映射;

S13:采用数据分用软件,如UMI-tools,对映射后的序列数据按细胞进行划分,得到序列分用数据;

S14:利用定量软件,如FeatureCounts,将映射并分用后的结果进行定量,得到一个基因×细胞的表达矩阵。

3.根据权利要求1所述的一种基于深度混合网络的单细胞转录组缺失值填补方法,其特征在于,在所述步骤S3中,所述自编码器包括编码器和解码器;所述编码器用于表达矩阵的降维处理,得到降维后的特征矩阵;所述解码器用于解码重建出新的表达矩阵。

4.根据权利要求3所述的一种基于深度混合网络的单细胞转录组缺失值填补方法,其特征在于,在所述步骤S3中,所述循环神经网络包括预测阵列和过滤器;其中:

所述预测阵列将所述自编码器得到的降维后的特征矩阵作为输入,预测所有基因的表达值,得到预测的表达矩阵;所述过滤器将预测的表达矩阵进行过滤,得到下一个循环神经网络输入。

5.根据权利要求4所述的一种基于深度混合网络的单细胞转录组缺失值填补方法,其特征在于,所述自编码器为单层隐藏层结构;所述预测阵列包含M个通道,每个通道对应一个基因m(1≤m≤M),每个通道包含四层结构,包括输入层,第一隐藏层、第二隐藏层和输出层;其中:

所述输入层用于输入降维后的特征矩阵;所述第一隐藏层用于计算所述循环神经网络每一个循环的权重,用于所述步骤S7中;所述第二隐藏层的输出结果用于计算所述输出层上每个通道的权重;所述输出层用于输出最终的填补输出。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学中山眼科中心,未经中山大学中山眼科中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911072613.5/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top