[发明专利]检测染色体非整倍性的方法、装置及系统在审
申请号: | 201810425745.0 | 申请日: | 2018-05-07 |
公开(公告)号: | CN108595912A | 公开(公告)日: | 2018-09-28 |
发明(设计)人: | 曾立董;吴增丁;金欢;徐伟彬;李林森;赵陆洋;张萌;颜钦 | 申请(专利权)人: | 深圳市瀚海基因生物科技有限公司 |
主分类号: | G06F19/18 | 分类号: | G06F19/18;C12Q1/6883;C12M1/34 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518000 广东省深圳市罗湖区莲塘*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 染色体 比对结果 染色体非整倍性 装置及系统 测序 检测染色体 参考序列 非整倍性 高灵敏度 检测结果 阴性样本 种检测 核酸 比对 样本 判定 检测 | ||
1.一种检测染色体非整倍性的方法,其特征在于,包括:
(1)对待测样本中的至少一部分核酸进行测序,获得包括读段的测序结果;
(2)将所述读段比对到第一参考序列,获得比对结果,所述比对结果包括所述读段定位于具体染色体的信息,所述第一参考序列为参考基因组上的比对能力为1的区域的集合,比对能力为1的区域为定位到所述参考基因组上唯一位置的区域;
(3)对于第一染色体,基于所述比对结果,确定定位到该第一染色体的读段的量;
(4)比较所述定位到该第一染色体的读段的量与阴性样本中的定位到相应第一染色体的读段的量,以判定该第一染色体的数目。
2.如权利要求1所述的方法,其特征在于,所述区域的比对能力的确定包括:
以大小为L1的第一窗口对所述参考基因组进行滑窗,获得多个所述区域,任选的,所述滑窗的步长为1bp;
将所述区域比对到所述参考基因组,基于所述区域比对到所述参考基因组的位置的数目计算该区域的比对能力;
任选的,
所述阴性样本的数目不小于20个,任选的不小于30个;
任选的,
以如下方式确定阴性样本中定位到相应第一染色体的读段的量:
以阴性样本替代待测样本进行(1)-(3),以确定定位到该阴性样本的第一染色体的读段的量;
以多个阴性样本的第一染色体的读段的量的均值作为阴性样本中定位到相应第一染色体的读段的量;
任选的,
所述第一参考序列为去除了下表所示区域的人参考基因组hg19序列中的至少一部分:
任选的,
所述第一参考序列为去除了符合以下条件的第二窗口对应的区域的参考基因组的至少一部分:该第二窗口的测序深度不小于所有第二窗口的测序深度的平均值的4倍,任选的,该第二窗口的测序深度不小于所有第二窗口的测序深度的平均值的6倍;
所述第二窗口通过利用大小为L2的窗口对所述参考基因组进行滑窗获得,任选的,所述滑窗的步长为L2,所述第二窗口的测序深度为比对上该第二窗口的读段的数目与该第二窗口大小的比值;
任选的,
所述第一参考序列为对参考基因组上第二窗口对应的区域进行以下处理的参考基因组的至少一部分进行以下处理:对百分位数大于98的第二窗口的测序深度赋值为百分位数等于98的第二窗口的测序深度,任选的,对百分位数大于99的第二窗口的测序深度赋值为百分位数等于99的第二窗口的测序深度;
所述第二窗口通过利用大小为L2的窗口对所述参考基因组进行滑窗获得,任选的,所述滑窗的步长为L2,所述第二窗口的测序深度为比对上该第二窗口的读段的数目与该第二窗口大小L2的比值;
任选的,
所述方法包括,在进行步骤(3)之前,进行如下(i)-(iii)中至少一项:
(i)去除所述测序结果中的长度不大于预定长度的读段;
(ii)去除所述比对结果中非定位到第一参考序列唯一位置的读段;
(iii)去除所述比对结果中错误率不小于预定错误率的读段,读段的错误率为比对后该读段上为插入、缺失和错配的碱基中的至少一种所占的比例。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市瀚海基因生物科技有限公司,未经深圳市瀚海基因生物科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810425745.0/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用