[发明专利]一种基于堆叠式集成策略的用于高效识别特定细胞系增强子-启动子相互作用的预测方法在审
申请号: | 202210500209.9 | 申请日: | 2022-05-09 |
公开(公告)号: | CN114974401A | 公开(公告)日: | 2022-08-30 |
发明(设计)人: | 樊永显;彭斌超;龚浩;孙贵聪;熊慧;刘梦;卢茜倩;潘应捷 | 申请(专利权)人: | 桂林电子科技大学 |
主分类号: | G16B5/00 | 分类号: | G16B5/00;G16B40/00;G16B30/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 541004 广*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 堆叠 集成 策略 用于 高效 识别 特定 细胞系 增强 启动子 相互作用 预测 方法 | ||
本发明公开了一种涉及生物信息领域的基于堆叠式集成策略用于高效识别特定细胞系增强子‑启动子相互作用的预测方法。该预测方法的步骤为:获取6个特定的人类细胞系中的增强子、启动子基因序列,对所有的细胞系的非平衡序列数据进行相同的数据预处理;使用6种特征提取方式提取特征;使用7种计算方法以堆叠式集成的方式训练模型。输入数据获得初步预测结果;调整特征提取方式和计算方法的组合方式优化集成模型,得到最终的预测结果。该方法提取基因序列中的多种信息特征,减少了计算时间,提高了预测特定细胞系增强子‑启动子相互作用的效果。
技术领域
本发明涉及生物信息领域,尤其涉及一种基于堆叠式集成策略的用于高效识别特定细胞系增强子-启动子相互作用的预测方法。
背景技术
增强子-启动子相互作用在基因的转录调控方面和人类疾病进展以及细胞分化方面起着至关重要的作用。启动子位于特定基因的上游,在基因表达的不同阶段起到了重要的调控作用,包含了大量关于基因注释的信息。增强子是一种能够调节时空基因表达并远距离作用其靶基因的关键顺式调控元件。增强子通过与启动子紧密接触,进一步激活其靶基因的转录水平。增强子启动子的相互作用机制十分复杂:一个启动子可以受多个增强子控制,多个启动子也可以由一个增强子调控;相互作用的增强子和启动子对由于染色质的立体折叠,其相互作用距离变化巨大,从数千个碱基对到数百万个碱基对不等。
在过去,人们主要采用基于染色体构象捕捉(3C)及其变体的湿实验方法来研究增强子-启动子相互作用,如高通量染色体构象捕获(Hi-C)和配对末端标签测序(ChIA-PET)的染色质相互作用分析。然而,这些实验方法存在技术难度大、实验耗时长、人力物力成本高的特点。但幸运的是,这些湿实验为我们提供了大量宝贵数据。
近年来,许多采用机器学习算法识别增强子-启动子相互作用的计算方法被人们相继提出。Whalen等人在2016年提出预测模型TargetFinder,该模型利用增强子、启动子和中间区域的功能基因组学信号预测增强子-启动子相互作用,并且后来多数研究者所使用的基准数据集都来源于此。在2017年,Yang等人仅使用基因序列特征和结合词嵌入方法提出一种预测模型PEP。Mao等人在2017年基于注意力机制和基于位置的特征解码构建了预测增强子-启动子相互作用的模型EPIANN。Singh等人在2018年将CNN和LSTM相结合,考虑DNA序列的长期依赖性,提出SPEID方法。在2019年,SIMCNN方法参照SPEID并指出仅用CNN结构就可以准确预测增强子-启动子相互作用。在2020年,EPIVAN、EPI-DLMH、SEPT、EPPredictor四种方法相继提出。EPIVAN利用预先训练好的DNA2vec向量进行序列嵌入提取特征,EPI-DLMH通过匹配启发式方法进行预测,SEPT基于领域对抗网络研究了跨细胞系的增强子-启动子相互作用,EPPredictor利用表观基因组和基于序列的特征预测增强子-启动子相互作用。
发明内容
1. 本发明是一种涉及生物信息领域的基于堆叠式集成策略的用于高效识别特定细胞系增强子-启动子相互作用的预测方法。
2. 该方法提取基因序列中的多种信息特征,并采用堆叠集成的策略构建出最优的分类模型;
该方法减少了计算时间,提高了预测特定细胞系增强子-启动子相互作用的效果。
3. 本发明提出的一种识别特定细胞系增强子-启动子相互作用的预测方法包括三个模块:数据预处理模块、特征提取模块和集成框架模块。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于桂林电子科技大学,未经桂林电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210500209.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种膨胀充填体的膨胀性能测试方法
- 下一篇:一种重金属污染农田土壤修复装置