[发明专利]测序深度的矫正方法及装置有效
申请号: | 201811614797.9 | 申请日: | 2018-12-27 |
公开(公告)号: | CN109584959B | 公开(公告)日: | 2020-10-27 |
发明(设计)人: | 张静波;柴景超;伍启熹;王建伟;刘倩;刘珂弟;唐宇 | 申请(专利权)人: | 北京优迅医学检验实验室有限公司 |
主分类号: | G16B20/30 | 分类号: | G16B20/30 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 江舟;王晓婷 |
地址: | 100195 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 深度 矫正 方法 装置 | ||
1.一种测序深度的矫正装置,其特征在于,包括:
获取模块,用于获取基因组上每个位点的GC含量,以及所述基因组的所有位点的测序深度;
划分模块,用于根据每个位点的GC含量将所述所有位点按照指定规则分成N个不同区间,其中,N为正整数;
确定模块,用于确定N个区间的平均测序深度的泊松分布;
处理模块,用于将所述泊松分布的值和所述所有位点的测序深度按照相同的排列方式进行排列,并将排列后的泊松分布的值作为矫正后的每个位点的测序深度。
2.根据权利要求1所述的装置,其特征在于,所述划分模块,用于将GC含量落在第一范围内的位点化分在N个不同区间的两端区间内;以及将GC含量落在第二范围内的位点化分在中间区间内,其中,中间区间为所述N个不同区间中,除所述两端区间的其他区间,所述第一范围内的位点数目小于所述第二范围内的位点数目。
3.根据权利要求1所述的装置,其特征在于,所述处理模块,还用于将所述排列后的泊松分布的值替换所述所有位点的测序深度,将替换后的所有位点的测序深度作为所述矫正后的每个位点的测序深度。
4.根据权利要求1所述的装置,其特征在于,所述处理模块,还用于将所述泊松分布的值和所述所有位点的测序深度均按照从小到大的顺序排列,或还用于将所述泊松分布的值和所述所有位点的测序深度按照从大到小的顺序排列。
5.根据权利要求1所述的装置,其特征在于,所述确定模块,还用于通过以下方式确定所述N个区间的平均深度:将所述基因组内所有位点的总深度除以所述基因组内位点的个数,得到所述N个区间的平均深度。
6.根据权利要求1所述的装置,其特征在于,所述装置还包括:
矫正模块,用于根据矫正后的的每个位点的测序深度和所述每个位点的GC含量矫正所述每个位点的GC偏好。
7.一种测序深度的矫正方法,其特征在于,包括:
获取基因组上每个位点的GC含量,以及所述基因组的所有位点的测序深度;
根据每个位点的GC含量将所述所有位点按照指定规则分成N个不同区间,其中,N为正整数;
确定N个区间的平均测序深度的泊松分布;
将所述泊松分布的值和所述所有位点的测序深度按照相同的排列方式进行排列,并将排列后的泊松分布的值作为矫正后的每个位点的测序深度。
8.根据权利要求7所述的方法,其特征在于,根据每个位点的GC含量将所述所有位点按照指定规则分成N个不同区间,包括:
将GC含量落在第一范围内的位点化分在N个不同区间的两端区间内;
将GC含量落在第二范围内的位点化分在中间区间内,其中,中间区间为所述N个不同区间中,除所述两端区间的其他区间,所述第一范围内的位点数目小于所述第二范围内的位点数目。
9.根据权利要求7所述的方法,其特征在于,将排列后的泊松分布的值作为矫正后的每个位点的测序深度,包括:
将所述排列后的泊松分布的值替换所述所有位点的测序深度;
将替换后的所有位点的测序深度作为所述矫正后的每个位点的测序深度。
10.根据权利要求7所述的方法,其特征在于,将所述泊松分布的值和所述所有位点的测序深度按照相同的排列方式进行排列,至少包括以下之一:
将所述泊松分布的值和所述所有位点的测序深度均按照从小到大的顺序排列;
将所述泊松分布的值和所述所有位点的测序深度按照从大到小的顺序排列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京优迅医学检验实验室有限公司,未经北京优迅医学检验实验室有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811614797.9/1.html,转载请声明来源钻瓜专利网。