[发明专利]检测装置和方法在审
申请号: | 201880067726.3 | 申请日: | 2018-10-17 |
公开(公告)号: | CN111247590A | 公开(公告)日: | 2020-06-05 |
发明(设计)人: | O·卡姆尼瓦;J·库拉布;R·瓦尔马 | 申请(专利权)人: | 阿费梅特里克斯公司 |
主分类号: | G16B25/10 | 分类号: | G16B25/10;G16B40/20 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 11038 | 代理人: | 程晨 |
地址: | 美国加*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 检测 装置 方法 | ||
一种系统和方法利用多样本批次对照在预期拷贝数变化的少量固定区域中进行高通量拷贝数调用。所述系统和方法利用应用于基于密度的聚类和先验知识映射的区域的中间拷贝数来进行对分量的最终拷贝数调用。
相关申请
本申请要求2017年10月17日提交的第62/573,475号美国临时申请的权益,所述临时申请的全部内容通过引用合并于此。
背景技术
拷贝数变异(CNV)已成为重要的遗传变异类型,并经常被纳入例如人类遗传性状的遗传分析中。尤其是某些基因组区域的CNV,已知与从药物代谢速率到器官移植结果的各种表型有关。例如,多种药物的代谢途径取决于单个生物体(例如真核生物体和原核生物体,以及动物、植物和微生物)具有多少特定基因的功能性拷贝。当给予标准剂量时,具有不同数目的基因功能性拷贝的单个生物体可能具有截然不同的药物代谢速率,从而导致严重的医学并发症。这就是为什么在基于微阵列基因分型数据进行的全基因组关联研究(GWAS)中经常调查预定义区域中的CNV的原因。但是,仍然难以实现有效、准确和高通量确定具有微阵列数据的拷贝数状态。
发明内容
在一个方面,提供了一种用于对拷贝数变异进行基因分型的方法。所述方法可以包括:将基于密度的聚类应用于数据图,以从高斯分量生成多个候选模型;从所述多个候选模型中选择最佳拟合模型,所述选择所述最佳拟合模型包含:将来自所述多个候选模型中的模型以及评分函数应用于所述分量,以生成分量评分;选择板效应值;基于所述分量评分为每个分量选择分量标签;利用所述板效应值作为每一个所述分量的点估计,并计算所述分量的估计统计参数的概率;评估所述模型针对概率公差的拟合度;如果所述模型不在所述概率公差内,则评估下一个模型;以及如果所述多个候选模型中没有一个满足所述概率公差,则对参数应用具有最高中值概率的模型;用历史分量数据配置归一化器,以调整每一个所述分量的均值和标准偏差,以生成调整后的混合组合;用所述调整后的混合组合配置分类器,以对未知样本进行分类,所述配置所述分类器包含:基于所述调整后的混合组合对分量密度进行加权;以及将所述未知样本与最可能分量进行比较;以及如果在样本位置评估的所述最可能分量的密度与第二最可能分量的密度之比高于某个临界值,并且在所述样本位置评估的所述最可能分量的绝对密度高于密度临界值,则为所述未知样本分配具有最高概率的分量标签。
在一些实施例中,所述评分函数被构建为先验密度乘以混合组合分量、板效应,和所述分量的权重的均值的乘积。
在一些实施例中,所述概率公差还包含所述概率的中值大于0.1且不存在单个概率小于0.001。
在一些实施例中,所述多个候选模型按复杂度降序排列。
在一些实施例中,所述数据图包含具有表示密度和中值log2比的轴的图。
在一些实施例中,所述中值log2比值包含在基因组区域的多个测量值中强度数据与参考值的log2比的中值。
在一些实施例中,所述强度数据包含来自微阵列的荧光强度测量。
在一些实施例中,所述微阵列包含被配置为与基因组或转录组中存在的至少10,000个不同靶序列杂交的核酸探针。
在一些实施例中,所述微阵列包含被配置为与基因组或转录组中存在的至少20,000个不同靶序列杂交的核酸探针。
在一些实施例中,所述微阵列包含被配置为与基因组或转录组中存在的至少10,000个不同靶外显子衍生的序列杂交的核酸探针。
在一些实施例中,所述数据图包含具有表示密度和中心趋势的任何测量的轴的图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿费梅特里克斯公司,未经阿费梅特里克斯公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201880067726.3/2.html,转载请声明来源钻瓜专利网。