[发明专利]一种基于Tn5矫正的ATAC-seq生物信息学分析方法及装置有效
申请号: | 202111085857.4 | 申请日: | 2021-09-16 |
公开(公告)号: | CN113838534B | 公开(公告)日: | 2023-08-01 |
发明(设计)人: | 颜光玗;张厚煜;卢婷;陈方尧 | 申请(专利权)人: | 中国医学科学院血液病医院(中国医学科学院血液学研究所) |
主分类号: | G16B50/30 | 分类号: | G16B50/30;G16B30/10 |
代理公司: | 天津滨海科纬知识产权代理有限公司 12211 | 代理人: | 魏凤巍 |
地址: | 300020 *** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 tn5 矫正 atac seq 生物 信息学 分析 方法 装置 | ||
1.一种基于Tn5矫正的ATAC-seq生物信息学分析方法,其特征在于,以二代测序产生的双端测序读长作为原始测序读长,依次执行以下步骤:
S1、对原始测序读长进行裁剪处理,裁剪掉接头污染,以使裁剪后的读长符合后续使用要求;
S2、将裁剪后的读长比对到物种的参考基因组上,进行文件存储,然后统计比对的综合指标;
S3、统计Tn5切割获得的片段长度分布;
S4、标记比对片段中起始和末端一致的重复片段,并去除标记的重复片段,为步骤S2中存储的文件建立索引,统计该文件中去除重复片段后的文件的指标;
S5、对步骤S4中去除掉重复片段的文件进行格式转换,以满足比对读长在相关命令下进行位移,进而获得单碱基精度的Tn5插入中心位点的要求,然后文件转换为之前格式;
S6、利用矫正工具和矫正方法进行Tn5偏好性矫正,并对返回的矫正后与矫正前的Tn5插入信号文件进行格式转换;
S7、利用基于信号值的工具,对矫正前后的Tn5插入信号进行峰检测并找到共享峰及特异峰。
2.根据权利要求1所述的基于Tn5矫正的ATAC-seq生物信息学分析方法,其特征在于:步骤S1中,原始测序读长在裁剪前后均需要进行质量评估,用于判断裁剪前后的读长质量。
3.根据权利要求2所述的基于Tn5矫正的ATAC-seq生物信息学分析方法,其特征在于,质量评估的指标包括:
每个碱基测序质量值,判断测序质量值是否大于设定值,用于判断原始测序读长数据和裁剪后读长数据质量是否提升;
每个碱基核苷酸含量分布,判断ATAC-seq数据前19个碱基是否由固定的核苷酸组成,且需判断后段核苷酸的比例是否保持稳定且对应于该物种核苷酸组成;
测序接头含量,用于判断测序接头的是否污染,以防影响比对效率。
4.根据权利要求1所述的基于Tn5矫正的ATAC-seq生物信息学分析方法,其特征在于:步骤S2中,将裁剪后的读长比对到物种的参考基因组后,还需要进行质量筛选,去除比对质量小于设定值,且未双端配对、非单一比对的读长。
5.根据权利要求1所述的基于Tn5矫正的ATAC-seq生物信息学分析方法,其特征在于,所述步骤S5的具体执行方法如下:
利用bedtools的bamtobed算法将步骤S4中去除掉重复片段的文件格式转换为bed文件,并且利用awk命令将比对读长进行位移以获得单碱基精度的Tn5插入中心位点;
位移方法如下:将比对到正链的读长向参考基因组3’端移动4个碱基对,将比对到负链的读长向参考基因组5’端移动5个碱基对,以获取其插入中心位点;
随后利用bedtools的bedtobam算法将bed文件转换之前格式的文件,供后续使用。
6.根据权利要求1所述的基于Tn5矫正的ATAC-seq生物信息学分析方法,其特征在于:所述步骤S6中,矫正工具为基于核苷酸依赖性的算法;
矫正方法具体为:使用19个碱基对的范围作为区间,利用核苷酸依赖性的信息进行矫正,用以矫正DNA基序和形状对于Tn5的影响。
7.一种基于Tn5矫正的ATAC-seq生物信息学分析装置,其特征在于,该装置在运行时能够实现权利要求1-6任一所述的基于Tn5矫正的ATAC-seq生物信息学分析方法。
8.一种电子设备,包括处理器,以及与处理器通信连接,且用于存储所述处理器可执行指令的存储器,其特征在于:所述处理器用于执行上述权利要求1-7任一所述的基于Tn5矫正的ATAC-seq生物信息学分析方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国医学科学院血液病医院(中国医学科学院血液学研究所),未经中国医学科学院血液病医院(中国医学科学院血液学研究所)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111085857.4/1.html,转载请声明来源钻瓜专利网。