[发明专利]确定核酸样本中CNV的方法、装置及应用有效

专利信息
申请号: 202010261297.2 申请日: 2020-04-03
公开(公告)号: CN113496761B 公开(公告)日: 2023-09-19
发明(设计)人: 王泰福;周青;孙井花;王文婧 申请(专利权)人: 深圳华大生命科学研究院
主分类号: G16B30/10 分类号: G16B30/10;G16B35/00;G06N20/00;G06N3/006
代理公司: 北京清亦华知识产权代理事务所(普通合伙) 11201 代理人: 张立
地址: 518083 广东*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 确定 核酸 样本 cnv 方法 装置 应用
【权利要求书】:

1.一种确定核酸样本中CNV的方法,其特征在于,包括:

(1)获取所述核酸样本的测序数据;

(2)基于所述测序数据,利用CNV检测软件,确定由多个初始CNV构成的初始CNV集合;

(3)针对每个所述初始CNV,确定分类特征;

(4)基于每个所述初始CNV的所述分类特征,利用预先构建的机器学习模型,对所述初始CNV集合进行筛选,以便获得最终CNV集合,

所述分类特征包括如下分类特征的全部:

所述初始CNV的测序深度、

所述初始CNV左侧两个测序读段长度区域的测序深度、

所述初始CNV右侧两个测序读段长度区域的测序深度、

所述初始CNV的GC含量、

所述初始CNV左侧两个测序读段长度区域的GC含量、

所述初始CNV右侧两个测序读段长度区域的GC含量、

所述初始CNV的类型、

所述初始CNV的长度、

所述初始CNV左侧两个测序读段长度区域中质量值10的测序读段数目、

所述初始CNV右侧两个测序读段长度区域中质量值10的测序读段数目、

所述初始CNV左侧两个测序读段长度区域的分裂比对读段的数目、

所述初始CNV右侧两个测序读段长度区域的分裂比对读段的数目、

所述初始CNV左侧两个测序读段长度区域内插入片段的大小在整个文库插入片段大小平均值的左右3倍标准差的范围以外的测序读段的数目、

所述初始CNV右侧两个测序读段长度区域内插入片段的大小在整个文库插入片段大小平均值的左右3倍标准差的范围以外的测序读段的数目、

所述初始CNV左侧两个测序读段长度区域的非配对测序读段数目、和

所述初始CNV右侧两个测序读段长度区域的非配对测序读段数目。

2.根据权利要求1所述的方法,其特征在于,所述分类特征是经过标准化处理的,所述标准化处理采用覆盖度进行;

优选地,所述机器模型为随机森林模型;

任选地,所述CNV检测软件包括选自manta、CNVnator、lumpy、delly和breakdancer的至少之一。

3.根据权利要求1所述的方法,其特征在于,在进行步骤(4)之前,预先对所述初始CNV集合进行过滤和合并处理,所述过滤和合并处理包括:

(a)除去与基因组序列gap区重叠的CNV;

(b)除去长度小于100bp的CNV;

(c)确定在不同软件中均存在的重复CNV,并对所述重复CNV进行合并;和

(d)如果所述重复CNV在不同软件中体现的类型不同,则删除所述重复CNV。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳华大生命科学研究院,未经深圳华大生命科学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010261297.2/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top