[发明专利]一种基于流形学习和主曲线的单细胞轨迹推断方法在审

专利信息
申请号: 202110109386.X 申请日: 2021-01-27
公开(公告)号: CN112768001A 公开(公告)日: 2021-05-07
发明(设计)人: 卢新国;江开宝;何可人 申请(专利权)人: 湖南大学
主分类号: G16B20/20 分类号: G16B20/20;G16B25/10
代理公司: 暂无信息 代理人: 暂无信息
地址: 410082 湖南省*** 国省代码: 湖南;43
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 流形 学习 曲线 单细胞 轨迹 推断 方法
【权利要求书】:

1.一种基于流形学习和主曲线的单细胞轨迹推断方法,其特征在于实施步骤为:

(1)收集已知单细胞RNA-seq数据,获得基因和细胞的关系;

(2)进行特征提取,选择可变基因作为特征;

(3)进行数据降维,缓解维度诅咒,得到低秩的数据矩阵;

(4)局部定义主曲线,提出一个初始化过程;

(5)基于分段子空间约束的均值漂移分割算法构建树结构模型;

(6)伪时间分析并建立直树拓扑图;

(7)差异表达基因检测。

2.根据权利要求1所述的一种基于流形学习和主曲线的单细胞轨迹推断方法,其特征在于数据收集阶段:

(1)从Nestorowa数据库中下载被实验验证的1656个来自小鼠造血系统的单细胞数据,将其作为分析数据的主体,其包含1656个细胞、4768个基因;

(2)从最常用的scRNA-seq数据集下载沿着线性轨迹分化的人类骨骼肌成肌细胞(HSMM)细胞数据集,将其作为分析数据的主体,其包含271个细胞、47192个基因。

3.根据权利要求1所述的一种基于流形学习和主曲线的单细胞轨迹推断方法,其特征在于特征提取阶段,数据的每一项值则为该基因在该细胞中的表达值,该基因表达值通过库大小归一化和log2转化进行调整;对于每个基因,计算每个基因的平均值和标准差,我们利用一种非参数回归方法(LOESS)去拟合均值和标准差之间的关系;最后,我们选择了曲线上方的差异显著的基因作为可变基因。

4.根据权利要求1所述的一种基于流形学习和主曲线的单细胞轨迹推断方法,其特征在于数据降维阶段和局部定义主曲线:

(1)在特征选择之后,每个细胞仍然有数百个分量,这对于可靠的获取细胞之间的相似度或者距离来说非常的困难,我们使用了多种方法进行降维,其中包括了MLLE、UMAP、PCA和SE方法,这些方法被认为对大多数数据集都是有效的;

(2)主曲线被Ozertem和Erdogmus提出了一种新的主曲线定义,算法提出,RD中的d维主曲面就是局部正交D-d维子空间中概率密度函数的局部极大点的集合,利用该算法初始化。

5.根据权利要求1所述的一种基于流形学习和主曲线的单细胞轨迹推断方法,其特征在于基于分段子空间约束的均值漂移分割SCMS算法构建树结构,用高斯核函数G(x)给出了任意点x的KDE核密度估计p(x);最初,SCMS算法将细胞轨迹初始化为数据点,将各向异性高斯核(或各向同性高斯核的带宽σ)的高斯核协方差矩阵H输入到算法中,然后对每个轨迹求均值移位向量m(x(j));最后进行特征分解,在x点上,子空间的均值漂移更新是通过将x投影到受限空间来实现的;为了解决数据点过于分散或者数据点过于聚集的问题,在采用SCMS算法得到离散主曲线后,构造一棵最小生成树(MST),然后将不在MST上的所有数据点分配给最近的分支并将SCMS算法分别应用于每个分支上的所有数据点;使用深度优先搜索,并基于相同的分支点重新连接分离出的分支来重建最终的树结构。

6.根据权利要求1所述的一种基于流形学习和主曲线的单细胞轨迹推断方法,其特征在于伪时间分析并建立直树拓扑图,从任意一个称为原点的端点开始,在D维空间中根据欧氏距离计算每个单元的伪时间,通过迭代将问题转化为具有固定起点的旅行商问题(TSP)来计算伪时间;从任一起点开始,然后使用广度优先搜索对二维平面上的节点和边进行水平排列,x轴表示伪时间;然后细胞的分化情况在它们的伪时间和它们所属的分支中被映射到所属的结构。

7.根据权利要求1所述的一种基于流形学习和主曲线的单细胞轨迹推断方法,其特征在于差异表达基因检测,在该方法中,我们将细胞的伪时间设为X,细胞的基因表达值设为Y,计算X与Y之间的MIC值,以衡量基因表达值是否随伪时间发生显著变化;计算每个基因和伪时间之间的MIC,并对每个基因序列的MIC进行排序,获得了对每条路径中影响最大的基因;对于每个基因,计算了在所有分支上的平均MIC和最大MIC,这可以找到整个细胞中差异表达的基因。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南大学,未经湖南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110109386.X/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top