[发明专利]制备参考数据库及对待测游离核酸样本进行目标区域序列比对的方法无效
申请号: | 201410117470.6 | 申请日: | 2014-03-26 |
公开(公告)号: | CN103955630A | 公开(公告)日: | 2014-07-30 |
发明(设计)人: | 田埂;郎继东;方建火;张丽娜 | 申请(专利权)人: | 田埂 |
主分类号: | G06F19/22 | 分类号: | G06F19/22;G06F19/28 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 李志东 |
地址: | 100084 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了制备参考数据库及对待测游离核酸样本进行目标区域序列比对的方法。其中,制备参考数据库的方法包括:对多个游离核酸样本进行测序;确定多个测序序列中比对到参考序列的目标区域上的每一个碱基的测序深度;将该测序深度针对每一个碱基在参考序列上的位置进行作图;基于所得到的图和所述多个游离核酸样本的个数,确定筛选阈值;基于该筛选阈值,对该参考序列的目标区域进行筛选,以便获得参考数据库。利用该方法,能够有效地针对目标区域进行参考数据库的制备,使制备获得的参考数据库的序列相对于目标区域大大减少,进而将该参考数据库用于待测游离核酸样本的目标区域序列比对时,工作量显著降低,但比对结果准确、可靠。 | ||
搜索关键词: | 制备 参考 数据库 对待 游离 核酸 样本 进行 目标 区域 序列 方法 | ||
【主权项】:
一种制备参考数据库的方法,其特征在于,包括以下步骤:(1)对多个游离核酸样本进行测序,以便获得多个测序序列;(2)确定所述多个测序序列中比对到参考序列的目标区域上的每一个碱基的测序深度;(3)将所述测序深度针对所述比对到参考序列的目标区域上的每一个碱基在参考序列上的位置进行作图,其中,所述测序深度为Y轴,所述碱基在参考序列上的位置为X轴;(4)基于所述步骤(3)中所得到的图和所述多个游离核酸样本的个数,确定比对到所述参考序列的目标区域上的多段连续区域的测序深度,作为筛选阈值;(5)基于所述筛选阈值,对所述参考序列的目标区域进行筛选,以便获得经过筛选的目标区域,所述经过筛选的目标区域构成所述参考数据库。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于田埂,未经田埂许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410117470.6/,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06 计算;推算;计数
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用