[发明专利]一种非编码区单核苷酸基因组变异的功能预测方法有效
申请号: | 201810804405.9 | 申请日: | 2018-07-20 |
公开(公告)号: | CN109033751B | 公开(公告)日: | 2021-07-27 |
发明(设计)人: | 刘宏德;孙啸;罗坤;马伟恒 | 申请(专利权)人: | 东南大学 |
主分类号: | G16B20/20 | 分类号: | G16B20/20;G16B30/00 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 王艳 |
地址: | 211102 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 编码 核苷酸 基因组 变异 功能 预测 方法 | ||
1.一种非编码区单核苷酸基因组变异的功能预测方法,其特征在于,包括以下步骤:
1)染色质开放区域识别;
2)转录因子结合位点识别:利用转录因子的位点特异频率矩阵,扫描染色质开放区域的转录因子的结合位点;基于编码转录因子基因表达水平,确定转录因子;以转录因子结合位点下游8千个碱基内的基因作为转录因子的靶基因;
3)评估单核苷酸变异的作用:基于转录因子的位点特异频率矩阵,计算位于转录因子结合位点区内的单核苷酸变异对转录因子结合的影响,识别显著改变转录因子结合能力的单核苷酸变异;进一步通过查看转录因子的靶基因生物学通路,评估单核苷酸变异的作用;
所述步骤3)中的评估单核苷酸变异的作用通过如下公式1进行评估:
其中P(i,j)和P(i,k)分别是在位点特异频率矩阵的第i个位置上,碱基j和碱基k的值,j和k属于腺嘌呤、鸟嘌呤、胞嘧啶和胸腺嘧啶的一种,所述F为正数,说明突变后、或者低频率基因型具有增加转录因子亲和性的作用,F为负数,说明野生型、或者高频率基因型具有增加转录因子亲和性的作用;F数值为正数且数值越大,表示突变后、或者低频率基因型具有更高的对转录因子的亲和性,相反,F数值为负数且数值越小,表示野生型、或者高频率基因型具有更高的对转录因子的亲和性;F为0,表示该基因型对转录因子结合没有影响。
2.根据权利要求1所述的非编码区单核苷酸基因组变异的功能预测方法,其特征在于,所述步骤1)染色质开放区域识别步骤为:对染色质开放区域测序数据开展读段的质量控制、回帖比对及读段富集区域识别,识别染色质开放区域。
3.根据权利要求2所述的非编码区单核苷酸基因组变异的功能预测方法,其特征在于,所述读段的质量值Q≥30,测序错误率≤0.001的读段用于回帖比对。
4.根据权利要求2所述的非编码区单核苷酸基因组变异的功能预测方法,其特征在于,所述读段富集区域的数学模型为泊松分布,富集显著性值公式为:
k为在基因组位点读段计数,λ为基因组读段计数的平均值,富集显著性值P的阈值为10-5。
5.根据权利要求1所述的非编码区单核苷酸基因组变异的功能预测方法,其特征在于,所述步骤1)中的染色质开放区域测序数据是脱氧核糖核酸酶I敏感位点测序数据、调控原件甲醛辅助分离测序数据和转座酶可及染色质实验测序数据中的一种或几种。
6.根据权利要求1所述的非编码区单核苷酸基因组变异的功能预测方法,其特征在于,所述步骤2)中的基因表达水平数据是微阵列数据或者核糖核酸测序数据。
7.根据权利要求1所述的非编码区单核苷酸基因组变异的功能预测方法,其特征在于,当基因的表达量FPKM≥8,则认为该转录因子在细胞中丰度高。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810804405.9/1.html,转载请声明来源钻瓜专利网。