[发明专利]自定义序列的分析方法、计算机存储介质及电子设备有效
申请号: | 202111257771.5 | 申请日: | 2021-10-27 |
公开(公告)号: | CN113921083B | 公开(公告)日: | 2022-11-25 |
发明(设计)人: | 丘佳倩;谢宁;许晓静 | 申请(专利权)人: | 云舟生物科技(广州)股份有限公司 |
主分类号: | G16B30/10 | 分类号: | G16B30/10;G16B50/00 |
代理公司: | 广州国鹏知识产权代理事务所(普通合伙) 44511 | 代理人: | 葛红 |
地址: | 510663 广东省广州市科学城掬泉*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 自定义 序列 分析 方法 计算机 存储 介质 电子设备 | ||
1.一种自定义序列的分析方法,其特征在于,包括以下步骤:
S1、构建标签序列库,所述标签序列库包含经过验证的标签序列及对应信息;
S2、获取用户的自定义序列;
S3、对所述自定义序列进行切割,得到干净序列;
S4、将所述干净序列与所述标签序列库进行Blast序列比对,获取所述干净序列的相似度信息;
S5、根据所述相似度信息判断所述自定义序列的来源及进化关系;
步骤S3包括:
S31、正向解析出所述自定义序列的序列头部的标签序列;
S32、逆向解析出所述自定义序列的序列尾部的标签序列,得到所述干净序列;
步骤S31包括:
S311、识别到所述自定义序列的头部ATG碱基后,将所述自定义序列的序列头部的标签序列逐个与所述标签序列库中的标签进行开头匹配;
S312、若所述序列头部与所述标签序列库的某个标签序列匹配成功,则记录所述序列头部的开始与结束位置,以及对应的所述标签序列的对应信息;
S313、截取掉匹配成功的所述序列头部的标签序列,在剩余的序列的头部增加ATG碱基后,再与所述标签序列库进行开头匹配;
S314、重复上述步骤S311至S313,直至所述自定义序列不能与所述标签序列库中的标签序列进行匹配;
S315、若所述序列头部与所述标签序列库的标签序列匹配不成功,则返回当前序列所在位置。
2.根据权利要求1所述的方法,其特征在于,所述标签序列库为基于NCBI以及PubMed生物平台构建的标签序列库。
3.根据权利要求1所述的方法,其特征在于,所述标签序列库中标签序列的对应信息包括:标签序列的名称,序列详情、序列长度以及序列的基本用途。
4.根据权利要求1所述的方法,其特征在于,步骤S32包括:
S321、搜索所述自定义序列的序列尾部的连续终止密码子,并截取所述连续终止密码子,得到所述干净序列;
S322、将所述自定义序列剩余的序列与所述标签序列库中的标签进行尾部匹配;
S323、若所述序列尾部与所述标签序列库中的某个标签序列匹配成功,则记录所述序列尾部的开始与结束位置,以及对应的所述标签序列的对应信息。
5.根据权利要求1所述的方法,其特征在于,还包括:
S6、输出所述自定义序列的解析报告。
6.根据权利要求5所述的方法,其特征在于,所述解析报告包括:所述自定义序列的序列长度、所述自定义序列的各标签序列所在位置及对应信息、所述干净序列匹配出的相同序列的对应信息。
7.一种计算机存储介质,其特征在于,包括一条或多条计算机指令,所述一条或多条计算机指令在执行时实现如权利要求1-6中任一项所述的方法。
8.一种电子设备,包括存储器和处理器,其特征在于,
所述存储器用于存储一条或多条计算机指令;
所述处理器用于调用并执行所述一条或多条计算机指令,从而实现如权利要求1-6中任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云舟生物科技(广州)股份有限公司,未经云舟生物科技(广州)股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111257771.5/1.html,转载请声明来源钻瓜专利网。