[发明专利]用于高通量测序的HRD panel位点选择优化方法及系统有效
申请号: | 202310266193.4 | 申请日: | 2023-03-20 |
公开(公告)号: | CN115985399B | 公开(公告)日: | 2023-07-04 |
发明(设计)人: | 张桥石;资意;陈敬臣 | 申请(专利权)人: | 广州迈景基因医学科技有限公司 |
主分类号: | G16B30/00 | 分类号: | G16B30/00;G16B20/20;G16B20/30 |
代理公司: | 深圳维启专利代理有限公司 44827 | 代理人: | 马立新 |
地址: | 510700 广东省广州市黄埔区广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 通量 hrd panel 选择 优化 方法 系统 | ||
1.一种用于高通量测序的HRD panel位点选择优化方法,其特征在于:包括以下步骤:
生成候选SNP位点库;
以所述候选SNP位点库为基础,按照以下方法选择与优化候选HRD panel位点:
在所述候选SNP位点库中随机挑选位点组合成初始候选panel位点;
对所述初始候选panel位点进行连锁不平衡分析,并循环调换优化位点,直到组成panel的位点间不存在连锁不平衡;
对于上一步生成的panel位点,对所述panel位点及其周围区域进行覆盖度预测打分,并循环调换优化位点,直到最后panel的位点组合满足不存在连锁不平衡,同时panel位点及其周围区域的覆盖度预测打分结果为100%,获得用于高通量测序的HRD panel位点;
构建WGS金标准数据集,并计算WGS金标准样本的HRD评分结果;
根据所述的用于高通量测序的HRD panel位点,构建panel模拟数据集,并确定相应类型模拟panel的HRD评分结果;
对所述panel模拟数据集中不同类型模拟panel位点的HRD评分结果与所述WGS金标准数据集中的WGS样本的金标准HRD评分结果进行相关性对比,如果相关性低于0.95,则重复步骤以所述候选SNP位点库为基础,按照以下方法选择与优化候选HRD panel位点、构建panel模拟数据集,并确定相应类型模拟panel的HRD评分结果和对所述panel模拟数据集中不同类型模拟位点panel的HRD评分结果与所述WGS金标准数据集中的WGS样本的金标准HRD评分结果进行相关性对比;
最后选择相关性结果评分最高的模拟panel位点组合作为最终生产的panel位点组合;
所述的对所述初始候选panel位点进行连锁不平衡分析,并循环调换优化位点,直到组成panel的位点间不存在连锁不平衡,具体包括:
对所述初始候选panel位点进行连锁不平衡分析,标记其中存在连锁不平衡的位点;
从候选SNP位点库中重新在该位点附近25KB-50KB范围内挑选新的SNP点进行调换,然后重新进行连锁不平衡分析;
循环调换优化位点,直到组成panel的位点间不存在连锁不平衡;
所述的对于上一步生成的panel位点,对所述panel位点及其周围区域进行覆盖度预测打分,并循环调换优化位点,直到最后panel的位点组合满足不存在连锁不平衡,同时panel位点及其周围区域的覆盖度预测打分结果为100%,获得用于高通量测序的HRD panel位点,具体包括:
对于上一步生成的panel位点,对所述panel位点及其周围100bp区域进行覆盖度预测打分;
标记位点及其周围100bp区域覆盖度预测打分结果不是100%的位点,从候选SNP位点库中重新在该位点附近25KB-50KB范围内挑选新的SNP点进行调换,并重新进行连锁不平衡分析,确保新挑选的位点在panel中不存在连锁不平衡,然后重新对优化的panel进行覆盖度预测打分;
循环调换优化位点,直到最后的panel位点组合满足不存在连锁不平衡与覆盖度预测打分为100%,循环结束,获得用于高通量测序的HRD panel位点。
2.根据权利要求1所述的用于高通量测序的HRD panel位点选择优化方法,其特征在于:在步骤在所述候选SNP位点库中随机挑选位点组合成初始候选panel位点之前,还包括:
构建骨架SNP位点库:对于候选SNP位点库,首先使用blast软件对其中的位点及其周围100bp区域序列在人基因组中进行同源性比对,选择位点及周围100bp区域同源性唯一位点;然后对通过同源性选择的位点进行片段GC含量计算,选择位点及周围100bp区域GC含量在40%-60%的位点,这些通过选择的位点构成骨架SNP位点库,用于后续panel重新优化与调换位点。
3.根据权利要求1或2所述的用于高通量测序的HRD panel位点选择优化方法,其特征在于:通过依次满足以下条件来选择候选SNP位点库的位点:
选择频率在0.2-0.8的中国人群高杂合SNP位点;
选择非基因外显子区、非缺失插入位点;
选择非染色体端粒区、非染色体着丝粒区、非基因组重复区位点;
选择非健康人群高频拷贝数变异区位点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州迈景基因医学科技有限公司,未经广州迈景基因医学科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310266193.4/1.html,转载请声明来源钻瓜专利网。