[发明专利]微生物的种特异共有序列的获得方法、装置及应用有效
申请号: | 202010254696.6 | 申请日: | 2020-04-02 |
公开(公告)号: | CN111477276B | 公开(公告)日: | 2020-12-15 |
发明(设计)人: | 嵇匆;邵俊斌;刘燕;齐霞;金宇丹;李启腾 | 申请(专利权)人: | 上海之江生物科技股份有限公司 |
主分类号: | G16B30/10 | 分类号: | G16B30/10;G16B25/20 |
代理公司: | 上海光华专利事务所(普通合伙) 31219 | 代理人: | 朱凌娇;许亦琳 |
地址: | 201201 上海市浦东新区张江高科*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 微生物 特异 共有 序列 获得 方法 装置 应用 | ||
1.一种微生物的种特异共有序列的获得方法,其特征在于,所述方法至少包括以下步骤:
S100,寻找候选共有序列:基于聚类算法对属于同一菌种的各个目标菌株的特异性序列进行聚类,获得多个候选种特异共有序列;
S200,验证和获得初次筛选种特异共有序列:
判断候选种特异共有序列是否满足以下条件:
1)株种覆盖度满足预设值;
2)有效拷贝数满足预设值;
若候选种特异共有序列满足以上所有条件,则为种特异共有序列;
其中,
株种覆盖度=(出现该候选种特异共有序列的目标菌株数量/目标菌株的总数量)*100%;
所述有效拷贝数采用公式(I)进行计算:
其中,
N为候选种特异共有序列拷贝数梯度的总数;
Ci为第i个候选种特异共有序列对应的拷贝数;
Si为出现第i个候选种特异共有序列的菌株数量;
Sall为目标菌株总数量。
2.如权利要求1所述的微生物的种特异共有序列的获得方法,其特征在于,所述特异性序列是指,同属于同一目标菌株的目标片段,所述目标片段所在区域是所述目标菌株的特异性区域。
3.如权利要求2所述的微生物的种特异共有序列的获得方法,其特征在于,所述特异性区域为特异性多拷贝区域。
4.如权利要求2所述的微生物的种特异共有序列的获得方法,其特征在于,所述特异性区域的获得方法包括如下步骤:
S110,将微生物目标片段与一个或多个对比菌株全基因组序列分别进行两两比对,去除相似性超过预设值的片段,获得若干剩余片段,作为第一轮切割片段T1~Tn,其中,n为≥1的整数;
S120,将所述第一轮切割片段T1~Tn分别与其余对比菌株的全基因组序列比对,去除相似性超过预设值的片段,获得剩余切割片段的集合作为微生物目标片段的候选特异性区域;
S130,验证和获得特异性区域:判断候选特异性区域是否满足以下条件:
1)搜寻公共数据库,寻找是否存在与候选特异性区域相似性大于预设值的其他物种;
2)将候选特异性区域分别与各对比菌株的全基因组序列,以及微生物目标片段来源菌株的寄主的全基因组序列进行比对,寻找是否存在相似性大于预设值的片段;
若候选特异性区域均不满足以上条件,则为微生物目标片段的特异性区域。
5.如权利要求4所述的微生物的种特异共有序列的获得方法,其特征在于,还包括以下特征中的一项或多项:
a.所述方法能够区别所述微生物目标片段来源菌株与对比菌株是否为同一种或亚种;
b.所述相似性是指微生物目标片段的覆盖率与匹配率的乘积,所述覆盖率=(相似序列片段长度/(微生物目标片段末端值-微生物目标片段起始值+1))*100%;
c.步骤S120中,所述第一轮切割片段T1~Tn分别与其余对比菌株的全基因组序列分组迭代比对;
d.所述相似性预设值超过95%;
e.所述方法还包括以下步骤:S111,将选定的相邻微生物目标片段进行两两比对,若出现相似性低于预设值的比对结果,则发出警报并显示目标株种对应的筛选条件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海之江生物科技股份有限公司,未经上海之江生物科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010254696.6/1.html,转载请声明来源钻瓜专利网。