[发明专利]谱系树中可变剪接模式和染色质状态动态变化的分析方法有效
申请号: | 202211040493.2 | 申请日: | 2022-08-29 |
公开(公告)号: | CN115273966B | 公开(公告)日: | 2023-03-31 |
发明(设计)人: | 徐云刚;张保军;杨娟;邹权;刘薇;郭琛;姚宇飞;李康;李月森;张栩瑞 | 申请(专利权)人: | 西安交通大学 |
主分类号: | G16B10/00 | 分类号: | G16B10/00;G16B30/00 |
代理公司: | 西安铭泽知识产权代理事务所(普通合伙) 61223 | 代理人: | 崔瑞迎 |
地址: | 710049*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 谱系 可变 剪接 模式 染色质 状态 动态 变化 分析 方法 | ||
1.谱系树中可变剪接模式和染色质状态动态变化的分析方法,其特征在于,包括:
获取谱系树中所有细胞类型的高通量测序数据;
建立基于混合高斯模型的概率生成模型,将高通量测序数据输入概率生成模型,分析可变剪接模式和染色质状态在谱系树上的动态变化;
所述概率生成模型由两部分组成:一是描述每种细胞状态的表观剪接模块;二是描述表观剪接模块在细胞代际间的状态转移的转移概率矩阵;
每个细胞状态被表示成由k个多元混合高斯模型组成的概率生成模型;其中,k为表观剪接模块个数,每个表观剪接模块表示为m元高斯混合模型,m等于该表观剪接模块的组蛋白修饰种类数;
给定一个具有L个细胞类型的谱系树和一个具有k个表观剪接模块和m个组蛋白修饰的生成概率模型,对于表示可变剪接区域组蛋白修饰信号的随机变量X,其混合高斯模型可表示为式(1):
其中,N(x|μk,∑k)称为混合模型中的第k个高斯分量,表示为θ={μ,∑,π,T},其中μ={μ1,…,μl,…,μL}和∑={∑1,…,∑l,…,∑L}分别表示m-维的均值向量和m×m-维的协方差矩阵;πk是混合系数,且满足及0≤πk≤1;
细胞代际间的关系则表示为转移概率矩阵T={T1,…,Tl,…,TL-1},除根节点外,每一个细胞与其父亲节点之间均有一个k×k-维的转移矩阵,转移矩阵中每个元素表示可变剪接事件在父亲节点属于模块i而在子代节点属于模块j的概率,即分化后可变剪接的染色质状态由模块i转移到模块j的概率。
2.根据权利要求1所述的谱系树中可变剪接模式和染色质状态动态变化的分析方法,其特征在于,所述概率生成模型用于检测剪接特异性和可供实验验证的表观遗传调控机制。
3.根据权利要求1所述的谱系树中可变剪接模式和染色质状态动态变化的分析方法,其特征在于,所述谱系树为人类胚胎干细胞分化谱系树、造血干细胞分化谱系树或者诱导多能干细胞分化谱系树。
4.根据权利要求1所述的谱系树中可变剪接模式和染色质状态动态变化的分析方法,其特征在于,所述高通量测序数据包括基因组、转录组和表观遗传组的高通量测序数据。
5.根据权利要求4所述的谱系树中可变剪接模式和染色质状态动态变化的分析方法,其特征在于,将所述高通量测序数据先进行预处理,然后再建立所述概率生成模型。
6.根据权利要求5所述的谱系树中可变剪接模式和染色质状态动态变化的分析方法,其特征在于,所述高通量测序数据预处理方式如下:获取谱系树中每种细胞类型的已比对到转录组的RNA-seq数据,使用rMATs软件检测谱系树中每个细胞类型的可变剪接事件,记录每个可变剪接区域的剪入百分比,合并所有细胞类型鉴定的可变剪接事件,使得谱系树中每种细胞类型都共用一组完全一样的可变剪接事件列表。
7.根据权利要求5所述的谱系树中可变剪接模式和染色质状态动态变化的分析方法,其特征在于,所述高通量测序数据预处理方式如下:获取谱系树中每种细胞类型的已比对到基因组的组蛋白修饰的ChIP-seq数据,使用MACS2软件检测谱系树中每个细胞类型的组蛋白修饰信号峰,针对每种组蛋白修饰,合并所有细胞类型中检测的信号峰,从而得到统一的一组组蛋白修饰信号峰列表;
基于信号峰与5’端剪接位点的距离d及峰的高度h,定义组蛋白修饰在可变剪接区间的强度为HM=h/d,对每一细胞类型的ChIP-seq数据进行相同处理后,将各自获得一个数据表,其中“行”表示可变剪接事件,“列”表示组蛋白修饰种类,“值”表示某一组蛋白修饰在某一可变剪接区域的信号峰强度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211040493.2/1.html,转载请声明来源钻瓜专利网。