[发明专利]检测人类基因组病毒整合位点的方法及装置有效
申请号: | 202010121537.9 | 申请日: | 2020-02-26 |
公开(公告)号: | CN110957008B | 公开(公告)日: | 2020-06-23 |
发明(设计)人: | 蒙裕欢;关宇佳;严慧;孟博;于世辉 | 申请(专利权)人: | 广州市金域转化医学研究院有限公司;广州金域医学检验集团股份有限公司 |
主分类号: | G16B20/30 | 分类号: | G16B20/30;G16B40/30 |
代理公司: | 广州新诺专利商标事务所有限公司 44100 | 代理人: | 李海恬 |
地址: | 510000 广东省广州市开*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 检测 人类基因组 病毒 整合 方法 装置 | ||
1.一种检测人类基因组病毒整合位点的方法,其特征在于,包括以下步骤:
基因组比对:获取基因检测得到的数据,将其中reads分别与人类参考基因组及人类病毒基因组进行比对,得到既不能与人类参考基因组匹配,又不能与人类病毒基因组匹配的第一reads集;
滑动切割:将上述第一reads集中各reads进行滑动切割,得到各reads的子序列,并使用等差数列标记编号,得到上述子序列组成的第二reads集;
短序列比对:将上述第二reads集中各子序列分别与人类参考基因组及人类病毒基因组进行比对,得到第二reads集中各子序列比对到人类参考基因组或人类病毒基因组上的起始位置数据;获取可比对到人类参考基因组或人类病毒基因组的子序列编号,按照每条reads中子序列的比对编号及比对到基因组的起始位置进行排序,根据上述位置数据进行聚类分析,所述聚类分析为:根据某一reads子序列比对到人类参考基因组或人类病毒基因组上的起始位置数据,按照各子序列比对到人类参考基因组或人类病毒基因组上的起始位置的升序排序后,相邻两起始位置之间最大差值≤5进行聚类分析;将聚类分析后得到的每个聚类的簇,与其对应子序列的编号进行相关性和协方差分析,筛选相关性为1或者-1的聚类的簇,并对相关性和协方差值的绝对值和进行加权计算,根据最大加权值找出每个read对应于人类基因组染色体或人类病毒基因组的最佳比对位置;当来源于同一reads的子序列按照等差数列标记编号依次比对到人类基因组或人类病毒基因组的同个区域,且上述子序列中具有位于reads末端的子序列,则认为该reads一端匹配人类基因组或人类病毒基因组,得到一端匹配人类基因组另一端匹配病毒基因组的第三reads集;
整合:将上述第三reads集的reads进行整合,计算得到病毒整合至人类基因组的整合位点。
2.根据权利要求1所述的检测人类基因组病毒整合位点的方法,其特征在于,所述滑动切割步骤中,切割窗口长度为20-50bp。
3.根据权利要求1所述的检测人类基因组病毒整合位点的方法,其特征在于,所述基因组比对步骤中,以end-to-end模式进行数据比对。
4.根据权利要求1所述的检测人类基因组病毒整合位点的方法,其特征在于,所述整合步骤中,根据第三reads集中各reads的比对位置和切割位点,得到病毒整合至人类基因组的整合位点。
5.根据权利要求1所述的检测人类基因组病毒整合位点的方法,其特征在于,还包括病毒种属分析,所述病毒种属分析步骤中,根据匹配到人类病毒基因组的reads,分析得到该病毒种属信息。
6.一种检测人类基因组病毒整合位点的装置,其特征在于,包括:
数据获取模块:用于获取基因检测得到的数据;
分析模块:按照权利要求1-5任一项所述的方法,分析得到人类基因组病毒整合位点;
输出模块:用于输出显示所述分析模块得到的结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州市金域转化医学研究院有限公司;广州金域医学检验集团股份有限公司,未经广州市金域转化医学研究院有限公司;广州金域医学检验集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010121537.9/1.html,转载请声明来源钻瓜专利网。