[发明专利]全长转录本的结构注释和比对结果评估方法有效
申请号: | 201710720711.X | 申请日: | 2017-08-21 |
公开(公告)号: | CN107563149B | 公开(公告)日: | 2020-10-23 |
发明(设计)人: | 王智健;简洁;姜丽荣;孙子奎 | 申请(专利权)人: | 上海派森诺生物科技股份有限公司 |
主分类号: | G16B20/00 | 分类号: | G16B20/00 |
代理公司: | 上海天翔知识产权代理有限公司 31224 | 代理人: | 吕伴 |
地址: | 200231 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明为全长转录本的结构注释和比对结果评估方法,公开的比对结果评估和基因结构注释方法,其使用了matchAnnot软件,脚本的作用是将已有的注释gtf文件和sam文件按matchAnnot软件所需的格式修改,使用matchAnnot进行结构注释和比对结果评估,优化了matchAnnot结果的展示方式,并进行统计。 | ||
搜索关键词: | 全长 转录 结构 注释 结果 评估 方法 | ||
【主权项】:
比对结果评估和基因结构注释方法,其特征在于,包括如下步骤:(1)获得参考基因组注释gtf文件和全长转录组与参考基因组比对结果sam文件中共有的染色体ID;(2)筛选sam文件中比对上非共有染色体的条目,进行整理后输出到no_annotation.txt中,而比对上共有染色体的条目则输出到tmp.sam中;(3)使用matchAnnot软件进行结构注释和比对结果评估,tmp.sam文件和gtf文件作为输入文件;(4)整理matchAnnot结果,将全长转录本的polyA motif单独输出到polyA_motif.txt中,对每条全长转录本提取与其最佳匹配的参考基因和参考转录本的信息,结合gtf中该基因的信息一并输出到matchinfo.xls中,对全长转录本与最佳匹配的参考转录本和参考基因的对应关系输出到transcript_summary.txt中,统计全长转录本的最高匹配得分并用R语言作饼图。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海派森诺生物科技股份有限公司,未经上海派森诺生物科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710720711.X/,转载请声明来源钻瓜专利网。