[发明专利]一种lncRNA鉴定和表达定量的分析方法有效
申请号: | 201911381879.8 | 申请日: | 2019-12-27 |
公开(公告)号: | CN111192637B | 公开(公告)日: | 2023-03-14 |
发明(设计)人: | 沈立;孙子奎 | 申请(专利权)人: | 上海派森诺生物科技股份有限公司 |
主分类号: | G16B30/10 | 分类号: | G16B30/10;G16B50/30 |
代理公司: | 上海天翔知识产权代理有限公司 31224 | 代理人: | 吕伴 |
地址: | 200030 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 lncrna 鉴定 表达 定量 分析 方法 | ||
本发明公开了一种lncRNA鉴定和表达定量的分析方法,其特征在于,包括一系列的测序数据过滤步骤、测序数据比对步骤、转录拼接步骤、基因比对步骤、lncRNA过滤步骤以及lncRNA分析步骤。本发明可以发现新的lncRNA,且本发明的方法提高了对lncRNA的注释准确性。
技术领域
本发明涉及基因检测领域,具体涉及一种lncRNA鉴定和表达定量的分析方法。
背景技术
非编码RNA是一类不翻译蛋白的功能性RNA分子,其中常见的具调控作用的非编码RNA包括siRNA、miRNA、piRNA以及长链非编码RNA。大量研究表明非编码RNA在表观遗传学的调控中扮演了越来越重要的角色。人们对lncRNA(Long noncoding RNAs,lncRNAs)的认识还处在初级阶段,lncRNA起初被认为是基因组转录的“噪音”,是RNA聚合酶II转录的副产物,不具有生物学功能。然而,有文献研究表明,lncRNA参与了X染色体沉默、基因组印记以及染色质修饰、转录激活、转录干扰、核内运输等多种重要的调控过程。lncRNA的这些调控作用也开始引起人们广泛的关注。
lncRNA因为不具有polyA尾,所以通常使用rRNA探针去除总RNA中的核糖体序列的方式富集lncRNA。现有的基于芯片的lncRNA分析方法,依赖于已知的lncRNA信息,无法发现新的lncRNA。
其他基于高通量测序的lncRNA分析方法,多使用旧的比对和注释软件,对lncRNA的注释准确性有限。
发明内容
为了克服现有技术的上述缺陷,本发明的目的在于提供一种lncRNA鉴定和表达定量的分析方法,所述方法适用于去除rRNA并且链特异性建库的RNASeq测序结果分析。
为了实现本发明的目的,所采用的技术方案是:
一种lncRNA鉴定和表达定量的分析方法,包括如下步骤:
步骤一,测序数据过滤步骤:
首先使用fastp软件去除测序结果中的接头和低质量序列:
所述fastp软件使用PE reads overlap信息自动识别接头序列,同时以5个碱基长度为窗口,从3’端向5’端滑动,截去窗口内平均质量小于20的窗口,最后保留长度大于50的reads;
接着将去除接头和低质量序列后的测序数据采用fastqc软件进行质量控制:
所述质量控制为根据RNASeq的测序特点提供质量控制标准;
步骤二,测序数据比对步骤:
使用hisat2软件将过滤后的数据与参考基因组进行比对:
首先从基因组数据库中下载对应物种的参考基因组,下载下来的基因组序列使用hisat2-build构建索引;
对于构建索引后的序列进行比对;
将比对完成的测序数据通过RSeQC进行质量控制;
步骤三,转录拼接步骤
使用stringtie进行转录拼接,重构样品的转录本序列;
首先需要对每个样品单独使用stringtie拼接,然后使用stringtie merge将所有样品的转录本进行合并;合并后的转录本为最后重构出来的转录本序列。
步骤四,基因比对步骤:
重构的转录本序列与参考基因组注释进行对比:
区分mRNA,已知lncRNA和新发现的lncRNA。
步骤五,lncRNA过滤步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海派森诺生物科技股份有限公司,未经上海派森诺生物科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911381879.8/2.html,转载请声明来源钻瓜专利网。