[发明专利]序列比较分析方法和系统有效
申请号: | 200880016476.7 | 申请日: | 2008-04-11 |
公开(公告)号: | CN101680872A | 公开(公告)日: | 2010-03-24 |
发明(设计)人: | 陈永庆;克里斯蒂亚内·霍尼施;迪尔克·J·范登博姆 | 申请(专利权)人: | 塞昆纳姆股份有限公司 |
主分类号: | G01N33/48 | 分类号: | G01N33/48 |
代理公司: | 北京律盟知识产权代理有限责任公司 | 代理人: | 刘国伟 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 序列 比较 分析 方法 系统 | ||
1.一种确定样本中是否存在靶核苷酸序列的方法,其包含:
a.鉴别(i)一组源自使所述样本中的核酸与特异性裂解剂接触而产生的裂解产物 的样本质量信号与(ii)一组源自接触或虚拟接触所述特异性裂解剂的参考核酸所 产生的裂解产物的参考质量信号之间的匹配峰型,并进行评分;
其中所述评分通过计算结合了位图得分、区别性特征匹配得分、和距离得分的总 得分而得出;
b.通过对样本信号组与参考信号组之间的最高等级匹配峰型亚组中的匹配峰型 进行迭代重复评分从而鉴别一个或多个最高等级匹配峰型;并且
c.由所述一个或多个最高等级匹配峰型之间的匹配,确定所述样本中是否存在所 述靶核苷酸序列。
2.根据权利要求1所述的方法,其中所述参考峰型通过以下步骤确定:
将一组内的所有参考峰按质量排列;
用峰强度表示各参考峰;
计算所述参考组内各峰强度之间的距离;和
对参考峰进行聚类以产生最小裂解反应组。
3.根据权利要求2所述的方法,其中所述峰强度通过以下步骤确定:
采集质谱亚组并过滤;
将一组或多组峰集合为一个群组;
使用所述群组中各峰的高度和质量计算所述群组的强度;和
将所述群组强度归一化。
4.根据权利要求2所述的方法,其中所述聚类通过以下步骤确定:
鉴别在一个参考组中存在但在其它组中不存在的峰;
进行子聚类,直到各群集仅具有一个序列或具有一组难区分的序列;
计算所述子群集中各峰强度的总和;和
评估各子群集之间的差异。
5.根据权利要求1所述的方法,其中所述样本匹配峰型通过以下步骤进一步校准:
将所述样本峰与某一质量窗口内的参考峰匹配;
通过评估总体偏差模式去除超出界限的样本峰;
选择在整个质量范围内均匀分布的高强度峰作为锚定峰;和
比较与从所述参考峰型预先选择的一组峰或数组锚定峰匹配的数量的峰。
6.根据权利要求5所述的方法,其中所述峰强度通过以下步骤调整:
将峰强度拟合至不同质量范围的标准曲线;
将所述曲线的中心质量区拟合至高斯曲线;和
通过所述调整修正所有检测峰的强度。
7.根据权利要求5所述的方法,其中所述锚定峰通过其质量和光谱质量进行校准。
8.根据权利要求1所述的方法,其包含鉴别所述参考组和/或所述样本组中具有所述 一个或多个最高等级匹配峰型的核苷酸序列的潜在序列变异。
9.根据权利要求1所述的方法,其包含对所述一个或多个最高等级匹配峰型之间的匹 配赋予置信度值。
10.根据权利要求1所述的方法,其中所述距离得分根据所述经鉴别特征向量与所有参 考特征向量之间的距离计算。
11.根据权利要求10所述的方法,其中所述距离为欧氏距离(Euclidian distance)。
12.根据权利要求1所述的方法,其进一步包括由所述匹配峰强度、丢失和额外峰强度、 沉默丢失峰强度与沉默额外峰强度的总和而计算的峰型一致性得分。
13.根据权利要求1所述的方法,其中最高等级匹配峰型通过对(b)中的匹配峰型进 行迭代重复评分约5次或5次以上、约10次或10次以上、约50次或50次以上或 约100次或100次以上循环来鉴别。
14.根据权利要求1所述的方法,其中所述样本质量信号组经历一种或多种信号处理方 法,所述信号处理方法选自由峰检测、校准、归一化、光谱质量、强度标度和复合 体调整滤波器组成的群组。
15.根据权利要求1所述的方法,其中所述参考质量信号组源自虚拟接触所述特异性裂 解剂的参考核酸所产生的裂解产物。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于塞昆纳姆股份有限公司,未经塞昆纳姆股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200880016476.7/1.html,转载请声明来源钻瓜专利网。