[发明专利]一种基于Tn5矫正的ATAC-seq生物信息学分析方法及装置有效
申请号: | 202111085857.4 | 申请日: | 2021-09-16 |
公开(公告)号: | CN113838534B | 公开(公告)日: | 2023-08-01 |
发明(设计)人: | 颜光玗;张厚煜;卢婷;陈方尧 | 申请(专利权)人: | 中国医学科学院血液病医院(中国医学科学院血液学研究所) |
主分类号: | G16B50/30 | 分类号: | G16B50/30;G16B30/10 |
代理公司: | 天津滨海科纬知识产权代理有限公司 12211 | 代理人: | 魏凤巍 |
地址: | 300020 *** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 tn5 矫正 atac seq 生物 信息学 分析 方法 装置 | ||
本发明提供了一种基于Tn5矫正的ATAC‑seq生物信息学分析方法,申请人基于前期的理论研究开发了一套基于Tn5矫正的ATAC‑seq生物信息学分析方法,通过该方法,申请人发现矫正Tn5偏好性可以提高鉴别顺势调控区域(英文简称CREs)开放性的显著程度,并且可以发现很多常规分析方法导致的假阴性CREs。本发明所述的基于Tn5矫正的ATAC‑seq生物信息学分析方法可以更简易且流程化地分析ATCA‑seq组学数据,更重要的是,通过该流程内部的矫正程序,很多可能参与重要调控功能的染色质开放区域会被发现,大大拓展了对于转录调控的研究。在精准医疗的时代,此流程势必将助力精准基因组学的发展以研究发育,疾病等重大医疗问题。
技术领域
本发明属于生物信息学分析技术领域,尤其是涉及一种基于Tn5矫正的ATAC-seq生物信息学分析方法及装置。
背景技术
基因的转录的精确调控是生命活动正常进行的基本保障。顺势调控元件(cis-regulatoy elements,英文简称CREs)负责在基因的近端(启动子)或者远端(增强子)通过开放和闭合,与转录因子(transcription factor,TF)配合来调控基因的表达,因此对于全基因组上CREs开放性的综合研究有重要的意义。2013年由斯坦福大学William Greenleaf实验室开发的利用转座酶研究染色质可进入性的高通量测序技术(assay fortransposase-accessible chromatin using sequencing,ATAC-seq)(Buenrostro etal.,2013),可以在少量甚至单细胞层面上捕获全基因组CREs的开放性。ATAC-seq的主要原理是利用Tn5转座酶可以自由插入在染色质的开放性区域,并同时加入测序接头以简化测序流程。据谷歌学术统计,截止2021年7月底ATAC-seq已经获得3506次引用,显示着其获得巨大成功。
虽然组学领域广泛假设Tn5的插入具有随机性,但是近年来有报道称Tn5的插入有偏好性(bias)(Adey et al.,2010;Green et al.,2012)。并且越来越多的研究表明Tn5的偏好性会很大程度影响对于转录因子的研究(Bentsen et al.,2020;KarabacakCalviello et al.,2019;Li et al.,2019;Lu et al.,2017)。而此偏好性由何原因引起?又是否会影响到基因组范围内CREs的研究?目前国际上未有报道。另外如何精确且流程化地分析ATAC-seq的数据,以供多数研究机构简易地操作,现鲜有进展。
申请人实验室于2016年成功地使用ATAC-seq技术研究造血发育中重编程的机制(Wang et al.,2019),并后续利用机器学习方法对Tn5的插入偏好性进行过综合性研究。发现DNA基序和DNA形状都会显著地影响Tn5偏好性,并且通过计算模拟的方法首次提出可以利用核苷酸依赖性的信息矫正DNA基序和DNA形状对于实际应用中Tn5的偏好性影响。
申请人基于前期的理论研究开发了一种基于Tn5矫正的ATAC-seq生物信息学分析方法及装置。
发明内容
有鉴于此,本发明旨在提出一种基于Tn5矫正的ATAC-seq生物信息学分析方法及装置,以解决目前缺少在Tn5插入偏好性研究的基础上,如何精确且流程化地分析ATAC-seq数据的问题。
为达到上述目的,本发明的技术方案是这样实现的:
第一方面,本发明提供了一种基于Tn5矫正的ATAC-seq生物信息学分析方法,以二代测序产生的双端测序读长作为原始测序读长,依次执行以下步骤:
S1、对原始测序读长进行裁剪处理,裁剪掉接头污染,以使裁剪后的读长符合后续使用要求;
S2、将裁剪后的读长比对到物种的参考基因组上,进行文件存储,然后统计比对的综合指标;
S3、统计Tn5切割获得的片段长度分布;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国医学科学院血液病医院(中国医学科学院血液学研究所),未经中国医学科学院血液病医院(中国医学科学院血液学研究所)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111085857.4/2.html,转载请声明来源钻瓜专利网。