[发明专利]一种融合基因组特征的m6 有效
申请号: | 202111148390.3 | 申请日: | 2021-09-27 |
公开(公告)号: | CN113889184B | 公开(公告)日: | 2023-08-11 |
发明(设计)人: | 张林;陈淑涛;刘辉;陈祥志 | 申请(专利权)人: | 中国矿业大学 |
主分类号: | G16B20/00 | 分类号: | G16B20/00;G06F17/16 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 221116 江苏省徐*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 融合 基因组 特征 base sup | ||
本发明名为一种融合基因组特征的m6A甲基化局部功能谱分解方法,属表观转录组学及模式识别研究领域。本发明目标是融合基因组特征对RNA甲基化局部功能谱进行高精度的分解,揭示m6A甲基化的详细调控机制。基于矩阵分解中的独立成分分析(ICA)方法,对m6A甲基化位点对应的基因组特征进行融合,以便充分考虑极强相关m6A位点之间的关联性。最终利用基于负熵的估计方法对m6A位点参与的多个调控通路进行恢复,进一步挖掘出每个调控通路对应的敏感位点,实现对m6A甲基化局部功能的高精度谱分解。本发明提出的算法能够为湿地实验揭示m6A甲基化的调控机制提供有力的参考。
技术领域
本发明涉及表观转录组学及模式识别研究领域,具体涉及一种融合基因组特征的m6A甲基化局部功能谱分解方法。
背景技术
在表观转录组学中,N6-甲基腺嘌呤(m6A)作为真核生物mRNA中最普遍和最丰富的转录后RNA修饰,是指发生在碱基A第六位N原子上的甲基化。虽然最近的很多研究显示了m6A修饰与关键的生物学功能及病理现象有关,但是m6A甲基化的详细调控机制尚不明确。多项研究指出,每种m6A甲基化调控因子均同时调控着许多位点的甲基化水平。共享相同调控因子的位点,其甲基化水平通常与调控因子的变化一致,并在功能上表现显著相关,呈现协同甲基化模式。由于生物“个体差异性”及同一个体生物重复性样本“组内差异性”的存在,功能谱分解时更常见的现象应该是“参与同一调控功能的有可能仅是局部修饰位点,而这部分修饰位点也极有可能只在局部条件下表达”。
到目前为止,已经开发了许多方法来进行基因表达谱、DNA甲基化谱等的局部功能谱分解。这些方法的基本思想主要可以分为双聚类以及矩阵分解两类。Lazzeroni等人提出了格子模型(Plaid),在把基因表达数据看成一个背景模型与多个双聚类叠加的基础上,使用最小化误差平方和来确定双聚类;Ihmels等人提出了迭代签名算法(ISA),将双聚类定义为一个由基因子集和与之共调控关系最为密切的条件子集一起构成的转录模块;Chen等人提出了基于富集约束框架的加权格子模型(FBCwPlaid),在对m6A甲基化局部功能谱进行分解的过程中引入了RNA表达水平,并利用基因本体论对双聚类结果进行约束;Zhang等人提出的融合同源信息的加权迭代签名算法(REW-ISA V2),在分析过程中不仅引入了RNA表达水平,还对m6A位点的同源性信息进行了充分考虑。Xie等人提出的定性双聚类算法(QUBIC),通过采用基因表达数据的定性(或半定量)测量和组合优化技术的组合,以更一般的形式解决双聚类问题。Orzechowski等人在unibic算法的基础上提出了runibic包,可以用于挖掘趋势保持的双簇。Engreitz等人基于矩阵分解中独立成分分析(ICA)的思想,将微阵列数据建模为可以共享基因的生物模块的组合,实现了对传统聚类方法的改进。Saelens等人对已有的方法进行了总结和比较,证实了基于矩阵分解思想的方法相对于双聚类方法具有更好的谱分解性能。然而,一方面,已有的基于矩阵分解思想的方法仅在基因表达谱上进行了测试分析,并没有针对RNA甲基化谱进行实际的优化或改进;另一方面,RNA甲基化谱中包含的隐含信息(例如位点的基因组特征等)并未得到充分利用,这导致目前很多方法的谱分解精度都还存在一定的改善空间。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国矿业大学,未经中国矿业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111148390.3/2.html,转载请声明来源钻瓜专利网。