[发明专利]一种对核酸序列信息进行匹配的方法有效
申请号: | 201510482636.9 | 申请日: | 2012-07-28 |
公开(公告)号: | CN105069325B | 公开(公告)日: | 2018-10-09 |
发明(设计)人: | 盛司潼 | 申请(专利权)人: | 盛司潼 |
主分类号: | G06F19/22 | 分类号: | G06F19/22 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518057 广东省深圳市南山区*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 核酸 序列 信息 进行 匹配 方法 | ||
本发明涉及信息处理领域,提供了一种对核酸序列信息进行匹配的方法,所述方法包括以下步骤:A、对数据库中的参考序列进行BWT变换,得匹配参考序列,并将匹配参考序列存储在数据库中;B、对数据库中的匹配参考序列进行间隔标记;C、将核酸序列片段依次分别与数据库中的匹配参考序列进行一致性匹配,得匹配核酸序列。本发明的对核酸序列信息进行匹配的方法能实现核酸序列信息与参考序列的快速匹配。
本案为2012年07月08日申请的,申请号为201210263634.7,发明名称为《一种对核酸序列信息进行匹配的系统和方法》的分案申请。
技术领域
本发明涉及信息处理领域,更具体地说,涉及一种对核酸序列信息进行匹配的系统和方法。
背景技术
美国科学家于1985年提出人类基因组计划,经过美国、英国、法兰西共和国、德意志联邦共和国、日本和中国科学家的共同努力,于2000年完成了人类基因组“工作框架图”。并于2001年公布了人类基因组图谱及初步分析结果。其研究内容还包括创建计算机分析管理系统(也即通过计算机分析系统对测序的结果进行处理,得到核酸序列信息),检验相关的伦理、法律及社会问题。在人类基因组图谱公布后,国内外开始积极投入到各个生物种族的基因图谱绘制的工作中。利用核酸序列信息与已有的基因组图谱(参考序列)进行比较,通过转录物组学和蛋白质组学等相关技术对基因表达谱、基因突变等进行匹配分析,可获得与疾病相关基因的信息。通过核酸序列信息与基因组图谱进行匹配、分析,并揭秘患病的根源,已成为生化医疗领域高度关注的问题,全球的基因测序技术也因此发展的如火如荼,但要准确快速的从浩瀚的测序结果数据中得到基因信息,却成了当前基因测序技术发展的瓶颈。
对核酸序列信息进行匹配的系统是利用计算机对测序所得的核酸序列片段在已知的参考序列上进行匹配,也即一一比对,根据匹配的结果进行后续的分析。对核酸序列信息进行匹配的方法是基于对核酸序列信息进行匹配的系统对核酸序列信息进行匹配的过程。
现有技术中,一种对核酸序列信息进行匹配的方法,所述方法包括步骤:A、根据允许错配的个数n,将每条核酸序列片段分成至少n+1条参与匹配的短片段,得短片段的数据库;B、根据参与匹配的短片段的长度建立并存储参考序列索引,得数据库;C、把每条核酸序列片段分段建立的短片段分别单独在数据库中进行匹配,得匹配结果。因为参考序列索引是等长的,根据概率的原理,存在完全相同的多个参考序列索引。该技术方案中,每条参与匹配的短片段依次与参考序列索引进行匹配,短片段需要与所有的参考序列索引分别进行匹配(短片段需要分别与多个相同的参考序列索引进行匹配),这将大大降低信息处理的速度。并且参考序列和核酸序列均需要进行分段处理,这将进一步增加了信息处理的工作量,从而进一步降低了信息处理的速度。另外,参考序列建立的参考序列索引和核酸序列分段建立的短片段,将产生大量的信息,这将增加信息处理装置的存储空间。
因此需要一种新的对核酸序列信息进行匹配的系统和方法,能够实现核酸序列与参考序列快速匹配。
发明内容
本发明的目的在于提供一种对核酸序列信息进行匹配的系统和方法,旨在解决现有技术核酸序列信息与参考序列进行匹配时,速度慢的问题。
为了实现发明目的,一种对核酸序列信息进行匹配的系统包括数据库、参考序列变化单元、标记单元和匹配单元。所述数据库,用于存储参考序列;所述参考序列变换单元,用于对数据库中的参考序列进行BWT变换,得匹配参考序列;所述标记单元,用于对数据库中的匹配参考序列进行间隔标记;所述匹配单元,用于将核酸序列片段依次与数据库中的匹配参考序列进行一致性匹配,得匹配核酸序列。
一致性匹配包括允许错配和不允许错配的情况。在允许N个错配的情况下,核酸序列片段至多有N个碱基与数据库中的匹配参考序列不一致称为一致性匹配;在不允许错配的情况下,核酸序列片段与数据库中的匹配参考序列完全一致称为一致性匹配。N为正整数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于盛司潼,未经盛司潼许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510482636.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种自动焊锡机的拉切剥线装置及其自动焊锡机
- 下一篇:把手
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置