[发明专利]增强子在全基因组相互作用研究方法有效
申请号: | 201310584990.3 | 申请日: | 2013-11-14 |
公开(公告)号: | CN103646192B | 公开(公告)日: | 2017-06-09 |
发明(设计)人: | 马永超;卑占宇;徐松涛;罗晓冰;常陆林;范文娟;吴华 | 申请(专利权)人: | 漯河医学高等专科学校 |
主分类号: | G06F19/18 | 分类号: | G06F19/18 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 462000 河南省漯河*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种增强子在全基因组相互作用研究方法,属于基因技术领域。该方法步骤为(1)数据转换采用UCSC网站liftover软件把增强子数据转换成hg18,对1760个增强子长度和分布进行统计分析。(2)数据过虑过虑掉两个染色质片段距离小于100kb的数据,得到hESC细胞系、IMR90细胞系以及它们的重复实验基因表达数据,求平均值。(3)数据注释将过虑好的数据比对到增强子数据中,统计不同细胞能捕获到的增强子数。(4)结果分析比较增强子在全基因组范围相互位点数据。本发明能很好地得到细胞核内染色质三维构象的信息,能知道基因的表达调控信息,鉴定一些未知调控序列,这些技术在鉴定全基因组上的长距离作用起着十分重要的作用。 | ||
搜索关键词: | 增强 基因组 相互作用 研究 方法 | ||
【主权项】:
一种增强子在全基因组相互作用研究方法,其特征在于:具体包括以下步骤:(1)数据转换:采用UCSC网站liftover软件把增强子数据转换成hg18;对1760个增强子长度和分布进行统计分析得到统计分布图,从中发现,增强子的长度大多小于2kbp,在各染色体上的分布不均匀;(2)数据过虑:过虑掉两个染色质片段距离小于100kb的数据,得到hESC细胞系、IMR90细胞系以及它们的重复实验基因表达数据,求两个数据的平均值作为基因表达的量;根据基因或者转录本的表达量,把基因分为:低表达、中表达、高表达,低表达的表达值<50、中表达为50<表达值<=500、高表达的表达值>500,针对每类基因数量进行统计;(3)数据注释:将过虑好的数据比对到增强子数据中,统计不同细胞实验能捕获到的增强子数,发现测序读序read数越多能捕获到的增强子也越多,但是当测序读序数达到一定数量时,增加大量的测序读序似乎对于捕获增强子的作用不显著;(4)结果分析:比较4组增强子在全基因组范围相互位点数据,在较大片段范围内1Mbp,四个实验组数据重合度比较高,在更精细的范围内1kb,4个实验组数据有着较大的区别,但是同一细胞系的重复试验差别小于不同细胞系;将与增强子作用的位点进行注释,得到相应数据,与增强子作用次数最多的是基因Genes,占0.39%,其次是重复序列序列,占0.20%,再次是基因上游20K的位置,Up20k,占0.17%,再次是基因组其他序列N0,占0.13%,再次是基因下游的20K,占0.09%,最少的增强子,Enhancer,占0.002%;在4个实验中,重复序列L1和增强子相互作用频率是最高的,L1是一个富含AT的重复序列,包含了RNA聚合酶III的内部启动子;另外在基因上游20K区域也是个高频区,大多数的基因的启动子都位于这个区域,很多增强子都是直接与启动子相互作用,从而调节基因的表达。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于漯河医学高等专科学校,未经漯河医学高等专科学校许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310584990.3/,转载请声明来源钻瓜专利网。
- 上一篇:形成嵌入式存储器件的方法
- 下一篇:一种实现数据传输的方法、装置和服务器
- 同类专利
- 专利分类
G06 计算;推算;计数
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用