[发明专利]一种同源基因特异性甲基化时序数据的分析方法有效
申请号: | 201810833596.1 | 申请日: | 2018-07-26 |
公开(公告)号: | CN108920904B | 公开(公告)日: | 2022-05-27 |
发明(设计)人: | 吉冠玉;吉红玉;王君文;胡琪;高飞 | 申请(专利权)人: | 深圳市易基因科技有限公司 |
主分类号: | G16B40/00 | 分类号: | G16B40/00;G16B20/30;G16B20/50 |
代理公司: | 北京科亿知识产权代理事务所(普通合伙) 11350 | 代理人: | 汤东凤 |
地址: | 518000 广东省深圳市坪山新区坪*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 同源 基因 特异性 甲基化 时序 数据 分析 方法 | ||
1.一种同源基因特异性甲基化时序数据的分析方法,其特征在于,包括如下步骤:
首先利用DNA甲基化测序数据序列特征和突变信息判定ASM区域,筛选出每个时期或者组别中特有的所述ASM区域,之后结合不同突变型对应的甲基化信息,利用某个时期的甲基化信息和其他不同时期样品进行比较,初步判定出原始时期特异性ASM区域,最后通过统计所有所述原始时期特异性ASM区域内的差异以及全部CpG位点数目,采用超几何检验,判定所述ASM区域是否为最终的时期特异性同源基因特异性甲基化区域。
2.根据权利要求1所述的同源基因特异性甲基化时序数据的分析方法,其特征在于,所述同源基因特异性甲基化时序数据的分析方法,包括如下步骤:
(1)将重亚硫酸盐测序数据与参考基因组比对、排序,去除冗余测序数据;
(2)利用CpG位点的重亚硫酸盐转化C的个数信息得到CpG位点上覆盖到的C的个数R(m)以及经过重亚硫酸盐转化后的T的个数信息R(t)、以及甲基化率Methy_Rate=R(m)/(R(m)+R(t));
(3)利用甲基化数据得到每个样品的核苷酸突变信息,利用相应的突变信息将有关reads分为两类(A,B),且每类的比例在0.3~0.7之间;分别统计区间内每条reads的对应位置的CpG位点的甲基化状态,定义读长中测序为C的位点为甲基化C(m),测序为T的位点为非甲基化C(n),并进一步统计测序读长的甲基化水平,methy_reads(i)=C(m)/(C(m)+C(n)),i∈AUB;
同时判定所述两类reads中的甲基化率在CpG位点上的甲基化情况methy_rate(Ai),methy_rate(Bi);
利用t检验判定所述两类reads的甲基化率差异,若同时满足p(methy_reads(i))0.05;p(methy_rate(i))0.05,为保证统计有效性,该过程筛选CpG为点数5;满足上述筛选条件则判定该区域为等位基因特异性甲基化区域。
3.根据权利要求2所述的同源基因特异性甲基化时序数据的分析方法,其特征在于,所述同源基因特异性甲基化时序数据的分析方法,还包括步骤(4):利用步骤(3)中筛选出的所述方法在研究中多个时期的组别分别进行统计,筛选出多个时期中只有单独一个时期特有的ASM区域为待选时期特异性ASM区间U(ASMi),并筛选出所有位点的CpG位点的甲基化信息;进一步利用核苷酸突变信息分别统计各个时期的测序读长的甲基化信息reads_stage(I,A or B),对应位点的甲基化信息Methy_rate_stage(I,A or B),分别统计时期特异性的差异情况methy_reads(I,A or B),对比reads_stage(I,A or B);methy_rate(I,A orB),对比Methy_rate_stage(I,A or B);分别采用t检验p(reads_stage,A or B)0.05;p(Methy_rate_stage,A or B)0.05的结果确认疑似阶段特异性ASM区间U(ASMi)。
4.根据权利要求3所述的同源基因特异性甲基化时序数据的分析方法,其特征在于,所述同源基因特异性甲基化时序数据的分析方法,还包括步骤(5):筛选步骤(4)中CpG甲基化信息,统计每个特异性ASM区间中的CpG位点的甲基化率在每个样品中的甲基化率,分别比较AB两种突变类型至少一种对应的reads的甲基化率有差异的位点个数k(ASMi),以及区间内的CpG个数m(CGi),总数为N,以及所有的疑似阶段特异性ASM区间U(ASMi)中的总数n:
5.根据权利要求4所述的同源基因特异性甲基化时序数据的分析方法,其特征在于,所述同源基因特异性甲基化时序数据的分析方法,还包括步骤(6):采用超几何分布判别相应的区域内的富集情况,取p0.05的ASM区域为显著时期特异性ASM区间:
6.根据权利要求2所述的同源基因特异性甲基化时序数据的分析方法,其特征在于,步骤(3)中的CpG位点采用如下方法进行提取:首先合并有所样品的全部CpG位点,筛选出在每个样品中所述ASM区域内的CpG位点,对于同组中重复样品,筛选出重复样品中取交集,筛选出所有样品中都存在于ASM区域内的CpG位点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市易基因科技有限公司,未经深圳市易基因科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810833596.1/1.html,转载请声明来源钻瓜专利网。