[发明专利]单细胞分类和筛选方法及其装置有效
申请号: | 201110245356.8 | 申请日: | 2011-08-25 |
公开(公告)号: | CN102952854A | 公开(公告)日: | 2013-03-06 |
发明(设计)人: | 徐讯;鲍莉;何伟明;侯勇;陶晔 | 申请(专利权)人: | 深圳华大基因科技有限公司;深圳华大基因研究院 |
主分类号: | C12Q1/68 | 分类号: | C12Q1/68;C12Q1/04;C12N5/00;C12M1/00 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 11038 | 代理人: | 曾晖 |
地址: | 518083 广东省深圳市盐田*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 单细胞 分类 筛选 方法 及其 装置 | ||
1.单细胞分类方法,包括以下步骤:
将每个单细胞样本经测序得到的reads结果与参考基因组序列进行比对,并将比对结果进行数据过滤;
根据过滤后的数据确定每个单细胞样本的一致基因型,并将所有单细胞样本的一致基因型保存为SNP数据集;
从已保存的SNP数据集提取与参考基因组SNP数据集位置对应的位点的基因型文件;
挑选细胞突变SNP位点,并根据细胞突变SNP位点的基因型文件,对细胞进行分类。
2.根据权利要求1所述单细胞分类方法,将比对结果进行数据过滤的操作,包括以下步骤:
当存在多对重复双末端reads时,在多对reads的序列完全一致时随机选择一对reads,将所述多对reads中其他重复双末端reads去除;和/或去除未唯一比对上参考基因组序列的reads。
3.根据权利要求1或2所述单细胞分类方法,根据过滤后的数据确定每个单细胞样本的一致基因型的操作,包括以下步骤:
根据过滤后的数据计算每个单细胞样本目标区域基因型的可能性文件;
根据基因型的可能性文件产生包含所有单细胞样本每个位点的伪基因组,从伪基因组中选择概率最大的基因型作为每个单细胞样本的一致基因型。
4.根据权利要求1或2或3所述单细胞分类方法,挑选细胞突变SNP位点的操作,包括以下步骤:
去除非群体间的SNP位点、去除存在杂合丢失的位点和/或去除已经公布的SNP位点,得到细胞突变SNP位点。
5.根据权利要求4所述单细胞分类方法,去除存在杂合丢失的位点的操作中,去除满足以下条件的位点:
当单细胞样本数为N时,N为自然数,正常组织直接提取DNA测序的最后一列为杂合位点;
其它N-1个单细胞样本中,杂合位点和数据丢失的样本数大于等于N-3。
6.根据权利要求1至5中任一所述单细胞分类方法,从已保存的SNP数据集提取与参考基因组SNP数据集位置对应的位点的基因型文件的操作,包括以下步骤:
每个位点的一致性基因型的质量值不小于20,秩检验p值不小于1%;对于杂合变异的SNPs:最好碱基型测序质量值不小于20、测序深度不小于6,次好碱基型测序质量值不小于20,测序深度不小于2,且两基因型测序深度的比值在0.2-5范围内;
根据参考基因组SNP数据集位置信息确定位点,提取每个细胞每个位点的基因分型数据生成基因型文件。
7.根据权利要求1至6中任一所述单细胞分类方法,对细胞进行分类之后,还包括以下步骤:
提取每个细胞样本信息,剔除存在异议的细胞。
8.根据权利要求1或7所述单细胞分类方法,对细胞进行分类之后,还包括以下步骤:
得到已预测基因组中基因的起止位置;
根据分类结果获得已分类群体,计算每类群体中每个基因所有SNP位点的统计量,并累加统计量;
对获得的统计量作差异检验,获得检验值;
将已预测基因按统计量或检验值进行排序,筛选出统计量或检验值最高的基因。
9.单细胞分类装置,包括:
数据过滤模块,将每个单细胞样本经测序得到的reads结果与参考基因组序列进行比对,并将比对结果进行数据过滤;
基因型确定模块,根据过滤后的数据确定每个单细胞样本的一致基因型,并将所有单细胞样本的一致基因型保存为SNP数据集;
基因型文件提取模块,从已保存的SNP数据集提取与参考基因组SNP数据集位置对应的位点的基因型文件;
分类模块,挑选细胞突变SNP位点,根据细胞群体突变SNP的基因型文件,对细胞进行分类。
10.根据权利要求9所述单细胞分类装置,其中:
数据过滤模块在有多对重复双末端reads时,从序列完全一致的多对reads中随机选择一对reads,将所述多对reads中其他重复双末端reads去除;和/或去除未唯一比对上参考基因组序列的reads。
11.根据权利要求9或10所述单细胞分类装置,其中:
基因型确定模块根据过滤后的数据计算每个单细胞样本目标区域基因型的可能性文件;根据基因型的可能性文件产生包含所有单细胞样本每个位点的伪基因组,从伪基因组中选择概率最大的基因型作为每个单细胞样本的一致基因型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳华大基因科技有限公司;深圳华大基因研究院,未经深圳华大基因科技有限公司;深圳华大基因研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110245356.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:全自动液压码坯机
- 下一篇:一种加温固化类喷漆零件的绝缘保护方法