[发明专利]用于使用基因表达数据去卷积混合细胞群的方法在审
申请号: | 201580054736.X | 申请日: | 2015-08-04 |
公开(公告)号: | CN107109471A | 公开(公告)日: | 2017-08-29 |
发明(设计)人: | P.J.达纳赫 | 申请(专利权)人: | 纳米线科技公司 |
主分类号: | C12Q1/68 | 分类号: | C12Q1/68;C40B30/02;G06F19/20;G06F19/24 |
代理公司: | 中国专利代理(香港)有限公司72001 | 代理人: | 彭昶,罗文锋 |
地址: | 美国华*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 使用 基因 表达 数据 卷积 混合 细胞 方法 | ||
与相关申请的交叉引用
本申请要求于2014年8月8日提交的美国临时申请号62/035,019的权益。前述专利申请的内容通过引用以其整体结合到本文中。
发明背景
生物样品常常包含不同类型物质的混合物(例如,不同类型的细胞,例如肿瘤细胞和健康细胞,多种微生物的混合物,不同生物流体的混合物,免疫细胞的混合物,等)。去卷积通常用于基于物质中已知的基因表达模式估计给定样品中物质的比例,和/或给定在给定样品中的已知物质比率估计每一类型物质的平均基因表达谱。
对于样品混合数据,常规去卷积方法常常假定相加模型:E(Y) = XB,其中Y为n样品和p基因的基因表达n*p矩阵,X为K细胞类型中p基因的原型基因表达的p*K矩阵,并且B为每一样品中每一细胞类型的量的n*K矩阵。相加模型通常假定样品中基因转录的量为每一样品细胞亚群中转录的量的总和。另外,通过使用相加模型,如果先前的实验允许估计细胞类型的原型基因表达谱X,那么从X和Y估计细胞类型量的矩阵B是可能的。或者,如果已知B (例如,通过在表达序型分析之前使样品流过细胞分选器),那么可估计每一细胞类型的平均表达谱。通过引入先前的信息如预期对于一个样品类型独特的基因的鉴定和对参数的约束以确保可辨识性,一些科学家已经惯例地使用该模型同时估计B和X。
然而,相加模型在许多方面是成问题的。例如,基因表达数据常常在分析前对数变换(除了qPCR数据,其已经以对数尺度存在),并且差异表达通常以倍数变化测量,而非相加性增长。通过变换数据和/或以这样的方式利用其以便将其并入相加模型,可能丧失准确度,导致不正确的结果(例如,样品中物质的假阳性和/或假阴性,或混合比例和/或细胞类型基因表达谱的低效估计)。
发明概述
本文所公开的方法描述使用相加模型和用于更准确的基因表达计算的基于对数的计算二者的去卷积方法。当分析样品混合物,包括但不限于法医分析中遇到的体液混合物和/或相似的样品混合物时,该设施预期将会具有显著益处。具体地,本文描述使用对数或乘法尺度和相加模型的统计方法,其可基于样品中各个靶基因的基因表达计算样品中给定体液的量。
在一些实施方案中,用于法医生物样品鉴定的方法可包括获得至少一种用于分析的生物样品,从生物样品提取总RNA,在至少一个测定中杂交总RNA与至少一个探针,和使用多路代码集分析至少一个测定。在一些实现中,分析测定可包括测定一组基因以在样品中定量,通过产生基因集中的每一基因的基因表达对数函数建模基因集中每一基因的基因表达,和基于基因集中每一基因的建模的基因表达产生生物样品中生物物质的量的最大似然估计。
在一些实施方案中,用于估计至少一种生物样品中物质的存在情况的方法可包括测定一组生物物质以在生物样品内检测,对于生物物质集中的每一生物物质,建模生物物质中一组独特基因的每一基因的表达,和使用生物物质中独特基因集的每一基因的建模的表达产生预期的基因比例模型。在一些实施方案中所述方法可进一步包括产生包含生物样品中生物物质集的每一生物物质的量的物质模型,通过使用预期的基因比例模型和物质模型产生预期的基因表达模型,和使用预期的基因表达模型估计生物样品中的基因表达。此外,所述方法可包括使用生物中的估计基因表达基于生物物质集中每一生物物质的最大似然估计产生估计的样品谱,对于生物物质集中的每一生物物质,计算似然比,所述似然比指示生物样品中由多大可能性包含生物物质,和基于计算的似然比确定生物物质集中每一生物物质在生物样品中是否存在。
在一些实施方案中,使用五分钟直接裂解方案,通过条码探针与特定mRNA靶多路溶液杂交,本文所述的装置、方法和系统可鉴定常见的法医相关的体液和/或各种样品中可能存在的各种物质。该具有最小动手需求的简化方案可促进mRNA序型分析在社会工作实验室中的常规使用。与大多数基于基因表达的分类器相反,所述算法可不涉及训练机器学习算法以优化正确召唤(call)样品的能力;而是,其可定义生物学上合理的体液样品中的基因表达模型并使用该模型评估样品对于存在特定流体所提供的证据的强度。该算法可允许对于每一体液类型的检测,计算对数似然,使得算法的结果在法庭环境中更具辩护力。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于纳米线科技公司,未经纳米线科技公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201580054736.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于诊断胃癌的miRNA生物标志物
- 下一篇:用于核酸检测的方法和组合物