[发明专利]一种基因序列难度分析模型的构建方法及其应用在审
申请号: | 201911337248.6 | 申请日: | 2019-12-23 |
公开(公告)号: | CN111192629A | 公开(公告)日: | 2020-05-22 |
发明(设计)人: | 赵文妍;段广有;丁砚书;方其;张艳;葛毅;廖国娟 | 申请(专利权)人: | 苏州金唯智生物科技有限公司 |
主分类号: | G16B20/00 | 分类号: | G16B20/00;G16B50/00 |
代理公司: | 北京三聚阳光知识产权代理有限公司 11250 | 代理人: | 徐律 |
地址: | 215123 江苏省苏州市苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基因 序列 难度 分析 模型 构建 方法 及其 应用 | ||
本发明涉及生物技术领域,具体涉及一种基因序列难度分析模型的构建方法及其应用,包括:取已知序列难度的不同基因序列若干,作为建模的数据库;对所述数据库中的基因序列进行序列特征提取;将所述序列特征与所述已知序列难度利用回归算法建立定量预测模型;发明人在生产过程中,发现待测序列基因序列的难度无法预测,进而难以满足客户对于基因合成周期需求,同时在大量待合成基因序列存在的情况下,无法进行有效的统筹安排,降低了基因合成的效率,因此,发明人研究发现,将已知序列难度的基因序列的特征与已知序列难度利用回归算法构建的模型可以准确预估基因序列的难度,以预测待测基因合成的周期。
技术领域
本发明涉及生物技术领域,具体涉及一种基因序列难度分析模型的构建方法及其应用。
背景技术
随着计算机、生物信息、基因测序等技术的不断发展,使全基因乃至基因组人工合成成为可能。基因合成是指运用生物学方法在体外合成所需基因的技术,它不仅可以对已有基因进行改造,还能创造出自然界中不存在的基因,即“改造生命”和“人造生命”。由于基因合成技术为人类改造生物开辟了一个全新的方向,任何与基因相联系的领域都需要进行人工基因的合成。在可预计的将来,基因合成将在生命科学、新能源、新材料、人工生命、核酸疫苗以及生物医药等领域中发挥巨大作用。
目前,为了快速的、高通量的进行基因合成,提供了工业化的基因合成方法,以期满足不断增长的研究院所或企业关于基因合成的需求。现有的工业化基因合成方法大致有7个模块化步骤,分别为PCR扩增、连接转化、挑取单克隆摇菌、菌液PCR鉴定、质粒抽提、Sanger测序、PCR扩增正确克隆,最终得到与预期一致的PCR产物片段。由于上述方法步骤繁多、通量低,整体流程的运行时间超过72小时,成本高。为了提高基因合成效率,中国专利文献CN107760672A公开的一种基于二代测序技术的工业化基因合成方法,快速简便,效率高。
随着基因合成的需求日益增长,基因合成公司会同时接到来自不同客户的大量的基因序列合成订单,而这些待合成的基因序列千差万别,基因序列的难度不同,无法预估基因序列合成的生产周期,即使采用标准化的工业化基因合成方法,也无法为客户提供基因合成的生产周期,同时由于待合成基因序列的周期不确定性,无法进行有效的统筹安排,降低了基因合成的效率。然而,还未有关于不同基因序列的基因序列难度分析的相关报道。
发明内容
因此,本发明要解决的技术问题在于提出一种基因序列难度分析模型的构建方法及其应用,所述构建方法构建的基因系列难度分析模型可以对不同基因序列的基因序列难度进行预测,依据基因序列的难度,可以为客户提供较为精准的序列订单的基因合成周期,同时也有利于基因合成公司的统筹安排,提高生产效率。
为解决上述技术问题,本发明提供了如下技术方案:
一种基因序列难度分析模型的构建方法,包括:
取已知序列难度的不同基因序列若干,作为建模的数据库;
对所述数据库中的基因序列进行序列特征提取;
将提取的序列特征与所述已知序列难度利用回归算法建立定量预测模型。
进一步的,所述已知序列难度的不同基因是指已知合成周期的不同基因。
进一步的,提取的序列特征包括:序列长度、序列GC含量、最大正向重复覆盖区域大小、正向最大重复与重复覆盖区比例、正向重复覆盖区域总和与序列长度的比例、最大反向重复覆盖区域大小、反向最大重复与重复覆盖区比例、反向重复覆盖区域总和与序列长度的比例、连续重复碱基个数和聚合物个数中的至少3个。
优选的,所述序列特征为序列长度、序列GC含量、最大正向重复覆盖区域大小、正向最大重复与重复覆盖区比例、正向重复覆盖区域总和与序列长度的比例、最大反向重复覆盖区域大小、反向最大重复与重复覆盖区比例、反向重复覆盖区域总和与序列长度的比例、连续重复碱基个数和聚合物个数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州金唯智生物科技有限公司,未经苏州金唯智生物科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911337248.6/2.html,转载请声明来源钻瓜专利网。