[发明专利]一种基于免疫算法的密码子优化方法有效
申请号: | 201710611752.5 | 申请日: | 2017-07-25 |
公开(公告)号: | CN110070913B | 公开(公告)日: | 2023-06-27 |
发明(设计)人: | 樊隆;孙岩;吴东明;黄小罗;张丽华;柳振宇 | 申请(专利权)人: | 南京金斯瑞生物科技有限公司 |
主分类号: | G16B25/10 | 分类号: | G16B25/10;G06N3/006;G06N3/126 |
代理公司: | 北京华睿卓成知识产权代理事务所(普通合伙) 11436 | 代理人: | 程淼 |
地址: | 211100 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 免疫 算法 密码子 优化 方法 | ||
1.一种基于免疫算法的密码子优化方法,其特征在于先后使用免疫算法和遗传算法分别对蛋白质编码序列进行局部多目标优化和全局多目标优化,再用穷举法对序列进行微调优化,从而最大限度的搜索到最优表达序列;其中
所述优化方法包括以下三个步骤:第一步是局部优化,即将蛋白质序列切割成无重叠的序列片段A1、A2……An,然后利用免疫算法,对每个序列片段完成密码子优化,生成近似最优DNA序列集B1、B2……Bn;第二步是全局优化,即利用遗传算法,基于B1、B2……Bn初始化蛋白质全长的DNA编码序列,筛选出蛋白质序列最优DNA序列C1;第三步是微调优化,包括对编码蛋白质N端区域所对应的DNA序列5’端进行穷举法优化,生成DNA序列C2,并消除表达抑制性模序,最终生成最优表达序列D;
其中所述的免疫遗传算法采用多目标优化方法对蛋白质片段进行局部优化,群体的初始化基于高表达蛋白编码序列的二联密码子表,直接采用同义密码子对每个基因进行编码;优化过程中通过计算免疫遗传算法的抗体信息熵、抗体群体相似度、抗体浓度和聚合适应度以及更新记忆单元来保证抗体多样性并防止群体退化现象,从而增加算法的全局搜索能力;
所述的遗传算法采用多目标优化方法用来对蛋白质全序进行全局优化,初始化群体基于局部优化的优化后片段随机生成,直接采用每个蛋白质片段的优化序列集对每个基因进行编码;
所述的微调优化利用穷举法对DNA序列5’端的折叠自由能MFE、Codon Context和CAI进行计算和排序,并根据排序结果选择最佳的蛋白序列N端编码序列。
2.根据权利要求1所述的优化方法,其特征是所述的蛋白质是指由二十个以上的氨基酸组成化合物;在定位上包括分泌蛋白、膜蛋白、胞质蛋白、细胞核内蛋白等;在功能上包含抗体蛋白、调节蛋白、结构蛋白等;在来源上包含同源表达蛋白和异源表达蛋白;在序列上包含天然蛋白和人工改造后的蛋白,完整的蛋白/抗体和截断的部分蛋白/抗体,以及2个或2个以上蛋白之间、蛋白与肽链之间形成的融合蛋白;所定义的抗体包括但不限于完整的抗体和Fab、ScFV、SdAb、嵌合抗体、双特异性抗体、Fc融合蛋白。
3.根据权利要求1所述的优化方法,其特征是所述的密码子优化方法至少适用于以下的宿主表达系统:1)哺乳动物表达系统;2)昆虫表达系统;3)酵母表达系统;4)大肠杆菌表达系统;5)枯草芽孢杆菌表达系统;6)植物表达系统和7)无细胞表达系统。
4.根据权利要求1所述的优化方法,其特征是所述的密码子优化方法至少适用于以下表达载体:瞬时表达载体和稳定表达载体、病毒表达载体和非病毒表达载体、诱导和非诱导表达载体。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京金斯瑞生物科技有限公司,未经南京金斯瑞生物科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710611752.5/1.html,转载请声明来源钻瓜专利网。