[发明专利]筛选候选插入片段的方法和系统在审
申请号: | 202010207885.8 | 申请日: | 2020-03-23 |
公开(公告)号: | CN113436683A | 公开(公告)日: | 2021-09-24 |
发明(设计)人: | 黄慧雅;曹玉冰;刘乙齐;郭亚琨 | 申请(专利权)人: | 北京合生基因科技有限公司 |
主分类号: | G16B30/00 | 分类号: | G16B30/00;G16B40/00;C12N15/11;C12N15/13 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 肖阳 |
地址: | 102206 北京市昌平*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 筛选 候选 插入 片段 方法 系统 | ||
1.一种筛选候选插入片段的方法,所述插入片段用于改造待测样本核酸序列,所述方法包括:
(1)基于用于改造待测样本核酸序列的候选基因,确定初始基因编码区序列;
(2)对所述初始基因编码区序列进行同义密码子替换,以便获得由多个候选编码区序列构成的候选编码区序列集合;
(3)将所述候选编码区序列与自身、宿主基因组和病毒基因组进行比对,并确定同源性高风险区域,以便对所述候选编码区序列进行同源性风险评分;
(4)基于所述同源性风险评分,在所述候选编码区序列集合中确定优选编码区序列子集。
2.根据权利要求1所述的方法,其特征在于,进一步包括:
基于所述宿主中的密码子频率,对所述候选编码区序列进行密码子对偏好性评分;或
基于所述宿主中的密码子频率,对所述候选编码区序列进行密码子偏好性评分;或
基于所述候选编码区序列中的C碱基频率、G碱基频率和CpG序列频率,对所述候选编码区序列进行CpG评分;或
基于所述候选编码区序列中的A碱基频率,T碱基频率和TpA序列频率,对所述候选编码区序列进行TpA评分;或
基于所述候选编码区序列的编码mRNA序列,预测RNA二级结构的最小自由能;或
基于所述候选编码区序列中的微卫星序列,对所述候选编码区序列进行微卫星不稳定性评分;
任选地,所述步骤(4)进一步包括基于所述同源性风险评分和包括下列评分的至少之一,在所述候选编码区序列集合中确定优选编码区序列子集,
所述密码子对偏好性评分、所述密码子偏好性评分、所述CpG评分、所述TpA评分、所述mRNA二级结构最小自由能和所述微卫星不稳定性评分。
3.根据权利要求1所述的方法,其特征在于,在步骤(3)中,采用滑窗序列比对法,所述滑窗的长度为12~17bp。
4.根据权利要求2所述的方法,其特征在于,所述密码子对偏好性评分是基于下列公式确定的:
5.根据权利要求2所述的方法,其特征在于,所述密码子偏好性评分是基于下列公式确定的:
6.根据权利要求2所述的方法,其特征在于,所述CpG评分是基于下列公式确定的:
7.根据权利要求2所述的方法,其特征在于,所述TpA评分是基于下列公式确定的:
8.根据权利要求2所述的方法,其特征在于,所述RNA二级结构最小自由能预测基于软件Mfold或ViennaRNA。
9.根据权利要求2所述的方法,其特征在于,所述微卫星不稳定性评分是基于如下方式确定的:
对于连续重复至少3次、微卫星序列长度小于同源性风险评分滑窗长度的微卫星区域,统计最长微卫星区域长度与频数,按优先级由高至低比较最长微卫星区域长度与频数,优先级越高、数值越大时微卫星不稳定性越高。
10.根据权利要求1所述的方法,其特征在于,在步骤(1)中,进一步确定初始非编码区序列,并且进一步包括:
(5)获取所述初始非编码区序列的第一同源亚型序列;
(6)基于所述初始非编码区序列和所述第一同源亚型序列,分别确定各自的保守性区域和非保守性区域;
(7)通过对对所述非保守性区域进行随机突变和截短处理的至少之一,获得由多个候选非编码区序列构成的候选非编码区序列集合:
(8)对所述非编码区序列进行所述同源性风险评分以及任选地微卫星不稳定性评分,在所述候选非编码区序列集合中确定优选非编码区序列子集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京合生基因科技有限公司,未经北京合生基因科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010207885.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:确定待测核酸样本变异率的方法和系统
- 下一篇:电动二轮/三轮车控制器