[发明专利]增强子在全基因组相互作用研究方法有效
申请号: | 201310584990.3 | 申请日: | 2013-11-14 |
公开(公告)号: | CN103646192B | 公开(公告)日: | 2017-06-09 |
发明(设计)人: | 马永超;卑占宇;徐松涛;罗晓冰;常陆林;范文娟;吴华 | 申请(专利权)人: | 漯河医学高等专科学校 |
主分类号: | G06F19/18 | 分类号: | G06F19/18 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 462000 河南省漯河*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 增强 基因组 相互作用 研究 方法 | ||
技术领域
本发明涉及一种增强子在全基因组相互作用研究方法,属于基因技术领域。
背景技术
随着人类基因组计划的结束,分子生物学家研究开始转向功能基因组,并已经开始着手寻找基因组功能片段。很多功能元件例如增强子(enhancers)、位点控制区域(LCRs),在染色质座位上远离其靶基因,这为我们发现和鉴定带来了困难。最近有研究表明,染色质可以通过相互作用对转录进行反式调控。研究细胞核内三维空间中功能元件的相互作用可以帮助我们了解基因组的功能调控机制。
增强子是一类短的DNA序列,其通过转录因子的介导能增强基因的表达水平。增强子一类典型的远距离调控元件,它可以位于基因的远端,甚至位于不同的染色体。增强子一般是通过比较基因组技术和增强子捕获技术(enhancer trap techniques)鉴定。
研究染色质相互作用的主流技术都是基于染色体捕获技术(chromatin conformation capture,3C)而建立的,从2002年最初的染色体捕获技术到现在的Hi-c,历经10余年的研究,科学家已经累积了很多染色质相互作用的数据。由于Hi-c能无偏差全基因组范围捕获染色质与染色质相互作用,且通量巨大。本发明选取人的两个细胞系Hi-c数据,来分析增强子在全基因组范围相互作用。
发明内容
本发明的目的在于提供一种增强子在全基因组相互作用研究方法,以便更加全面地研究增强子在基因中的作用,更好地了解基因组的功能调控机制。
为了实现上述目的,本发明的技术方案如下。
一种增强子在全基因组相互作用研究方法,具体包括以下步骤:
(1)数据转换:
由于增强子数据库的基因组位置是hg19而Hi-c的数据是hg18,采用UCSC网站liftover软件把增强子数据转换成hg18。对1760个增强子长度和分布进行统计分析得到统计分布图,从中发现,增强子的长度大多小于2kbp,在各染色体上的分布不均匀。
(2)数据过虑:
过虑掉两个染色质片段距离小于100kb的数据,得到hESC细胞系、IMR90细胞系以及它们的重复实验基因表达数据,求两个数据的平均值作为基因表达的量。根据基因或者转录本的表达量,把基因分为:低表达(表达值<50)、中表达(50<表达值<=500)、高表达(表达值>500),针对每类基因数量进行统计。
(3)数据注释:
将过虑好的数据比对到增强子数据中,统计不同细胞实验能捕获到的增强子数,发现,测序读序(read)数越多能捕获到的增强子也越多,但是当测序读序数达到一定数量时,增加大量的测序读序似乎对于捕获增强子的作用不显著。
(4)结果分析:
比较4组增强子在全基因组范围相互位点数据,在较大片段范围内(1Mbp),四个实验组数据重合度比较高,在更精细的范围内(1kb),4个实验组数据有着较大的区别,但是同一细胞系的重复试验差别小于不同细胞系。这表明用Hi-c捕获细胞系的染色质相互作用时,捕获到的是细胞系的一个平均的相互作用,一个细胞系存在着大量的细胞,很难保证每个细胞处于同样状态,由于基因表达的时空差异,染色质的在核内的三维空间也是一种动态的过程。目前的技术限制很难做到单细胞的染色质构象捕获。
将与增强子作用的位点进行注释,得到相应数据,与增强子作用次数最多的是基因(Genes,大约占0.39%),其次是重复序列序列(大约占0.20%),再次是基因上游20K的位置(Up20k,约占17%),再次是基因组其他序列(NO,约占13%),再次是基因下游的20K(Down20k,约占9%),最少的增强子(Enhancer,约占0.2%)。
每个增强子平均能捕获到几十个作用片段,说明增强子在起作用时候,增强子和其他序列形成了一个以基因为中心比较复杂的三维结构。在增强子相互作用的片段中,基因与增强子相互租用频率最高,这表明不管基因表达状况如何,和基因在三维空间上的距离都是靠近的。重复序列是一个高频率的相互作用类型,这表明有的重复序参与基因表达,有的增强子可能在维持染色质的三维结构上起着重要的作用。在4个实验中,重复序列L1和增强子相互作用频率是最高的,L1是一个富含AT的重复序列,包含了RNA聚合酶III的内部启动子。另外在基因上游20K区域也是个高频区,大多数的基因的启动子都位于这个区域,很多增强子都是直接与启动子相互作用,从而调节基因的表达。另外增强子与增强子也存在着相互作用,这可能提示基因需要多个增强子作用,以增强某个时刻的高表达。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于漯河医学高等专科学校,未经漯河医学高等专科学校许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310584990.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:形成嵌入式存储器件的方法
- 下一篇:一种实现数据传输的方法、装置和服务器
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用