[发明专利]通过解链曲线分簇的SNP检测有效
申请号: | 201080015726.2 | 申请日: | 2010-02-26 |
公开(公告)号: | CN102365147A | 公开(公告)日: | 2012-02-29 |
发明(设计)人: | T·豪瑟 | 申请(专利权)人: | 生物辐射实验室股份有限公司 |
主分类号: | B23K26/04 | 分类号: | B23K26/04 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 李小芳 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 通过 解链 曲线 snp 检测 | ||
1.一种标识核苷酸序列之间的序列变异的方法,所述方法包括:
接收多个数据点集合,每个集合对应于包含两个核苷酸序列的双链分子的 副本的不同样本,集合的每个数据点包括所述样本的信号值和温度值,其中所 述温度对于每个相继数据点上升,其中每个集合定义一条解链曲线;
至少一个处理器通过以下步骤确定各解链曲线的解链区:
对于每条解链曲线:
取二阶导数;
标识所述二阶导数的函数与边界阈值交叉处的开始和结束温 度;
基于所述各解链曲线的相应开始温度,标识解链区开始;
基于所述各解链曲线的相应结束温度,标识解链区结束;
将每条解链曲线指派给相应的簇,其中指派给相同簇的解链曲线相对于其 他簇中的解链曲线在所述解链区中具有一种或多种相似性质;以及
将与至少一簇相对应的所述核苷酸序列的至少一部分标识为相对于另一 簇的所述核苷酸序列具有序列变异。
2.如权利要求1所述的方法,其特征在于,标识所述解链区开始包括将 大于预定量的其他开始温度的相应开始温度标识为所述解链区开始,且其中标 识所述解链区结束包括将小于预定量的其他结束温度的相应结束温度标识为 所述解链区结束。
3.如权利要求2所述的方法,其特征在于,所述预定量的其他开始温度 是百分比。
4.如权利要求1所述的方法,其特征在于,所述双链分子是基因。
5.如权利要求4所述的方法,其特征在于,每个样本包含来自不同生物 体的相同基因。
6.如权利要求4所述的方法,其特征在于,所述序列变异是突变。
7.如权利要求1所述的方法,其特征在于,所述二阶导数的所述函数是 所述二阶导数的移动平均。
8.如权利要求1所述的方法,其特征在于,进一步包括:
在将所述解链曲线指派给簇之前,通过以下步骤来规范化每条解链曲线:
偏移每条解链曲线的所述数据点从而结束区域内的点的平均值为第 一值,其中所述结束区域是始于所述解链区结束处的预定温度范围;以及
将该解链曲线乘以一数字以使得开始区域中的所述数据点的平均值 为第二值,其中所述开始区域是结束于所述解链区开始处的预定温度范 围。
9.如权利要求8所述的方法,其特征在于,所述第一值是0且所述第二 值是1。
10.一种标识核苷酸序列之间的序列变异的方法,所述方法包括:
接收多个数据点集合,每个集合对应于包含两个核苷酸序列的双链分子的 副本的不同样本,集合的每个数据点包括所述样本的信号值和温度值,其中所 述温度对于每个相继数据点上升,其中每个集合定义一条解链曲线;
确定具有解链区开始和解链区结束的解链区;
至少一个处理器通过以下步骤执行每条解链曲线的第一规范化:
修改该解链曲线的所述数据点从而结束区域内的数据点的平均值为 第一数字,其中所述结束区域是始于所述解链区结束处的预定温度范围; 以及
修改该解链曲线的所述数据点以使得开始区域中的所述数据点的平 均值为第二数字,其中所述开始区域是结束于所述解链区开始处的预定温 度范围;
对于每条解链曲线,标识该解链曲线与阈值交叉处的阈值温度;
从各个阈值温度计算平均阈值温度;
平移每条解链曲线从而该解链曲线在所述平均阈值温度处与所述阈值交 叉;
执行对每条解链曲线的第二规范化,包括:
修改该解链曲线上具有比所述平均阈值温度低的温度的所述数据点 以使得所述开始区域中的所述数据点的平均值为第三数字;
将每条解链曲线指派给相应的簇,其中指派给相同簇的解链曲线相对于其 他簇中的解链曲线在所述解链区中具有一种或多种相似性质;以及
将与至少一簇相对应的所述核苷酸序列的至少一部分标识为相对于另一 簇的所述核苷酸序列具有序列变异。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于生物辐射实验室股份有限公司,未经生物辐射实验室股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201080015726.2/1.html,转载请声明来源钻瓜专利网。