[发明专利]用于高精度识别变体的系统和方法有效
申请号: | 201680054282.0 | 申请日: | 2016-08-25 |
公开(公告)号: | CN108351917B | 公开(公告)日: | 2022-03-08 |
发明(设计)人: | J·Z·桑伯恩 | 申请(专利权)人: | 南托米克斯有限责任公司 |
主分类号: | G16B50/00 | 分类号: | G16B50/00;G16B35/00;G16B45/00;G16C20/60;G16B30/00;G16B20/00 |
代理公司: | 北京市中伦律师事务所 11410 | 代理人: | 杨黎峰;钟锦舜 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 高精度 识别 变体 系统 方法 | ||
1.一种计算机模拟预测患者HLA分型的方法,其包含:
提供包括多个已知且不同的HLA等位基因序列的参考序列;
提供多个患者序列读段,其中,至少一些所述患者序列读段包括编码患者特异性HLA的序列;
将所述多个患者序列读段分解成多个相应的k聚体组;
使用参考序列和所述多个相应的k聚体组生成德布鲁因图;
使用由所述多个患者序列读段的相应投票计算的复合匹配分数来对每个已知且不同的HLA等位基因进行排序,并且,其中每个投票使用与已知且不同的HLA等位基因中相应片段匹配的k聚体;
将最高级排序HLA等位基因鉴定为所述患者的第一HLA分型;以及
使用经调整的复合匹配分数来重新排序剩余的非最高级排序的已知且不同的HLA等位基因,以将经调整的最高级排序的HLA等位基因鉴定为所述患者的第二HLA分型,其中所述经调整的复合匹配分数由降低而不是消除匹配第一HLA分型的k聚体的权重来计算。
2.根据权利要求1所述的方法,其中,所述参考序列包括至少一种HLA分型的等位基因,其具有至少1%的等位基因频率。
3.根据权利要求1所述的方法,其中,所述参考序列包括至少一种HLA分型的至少10种不同的等位基因。
4.根据权利要求1所述的方法,其中,所述参考序列包括至少两种不同的HLA分型的等位基因。
5.根据权利要求1所述的方法,其中,HLA分型为HLA-A分型,HLA-B分型,HLA-C分型,HLA-DRB-1分型和/或HLA-DQB-1分型。
6.根据权利要求1所述的方法,其中,所述多个患者序列读段包含多个DNA测序读段和RNA测序读段中的至少一个。
7.根据权利要求1所述的方法,其中,所述患者序列读段映射至染色体6p21.3。
8.根据权利要求1所述的方法,其中,所述患者序列读段是下一代测序读段并且还包含元数据。
9.根据权利要求1所述的方法,其中,所述患者序列读段具有50至250个碱基之间的长度。
10.根据权利要求1所述的方法,其中,所述k聚体具有10-20的长度。
11.根据权利要求1所述的方法,其中,所述k聚体具有患者序列读段长度的5%至15%之间的长度。
12.根据权利要求1所述的方法,其中,所述复合匹配分数是来自多个患者序列读段的所有投票的总和。
13.根据权利要求1所述的方法,其中,所述投票是表示匹配k聚体与每患者序列读段的k聚体总数的比例的值。
14.根据权利要求1所述的方法,其中,经调整的复合匹配分数由所述多个患者序列读段的相应经调整的投票计算得到。
15.根据权利要求14所述的方法,其中,通过降低匹配第一HLA分型的k聚体的权重来计算经调整的投票。
16.根据权利要求1-15中任一项所述的方法,其中,所述参考序列包括至少一种HLA分型的等位基因,其具有至少1%的等位基因频率,或者,其中所述参考序列包括至少一种HLA分型的至少10种不同的等位基因,或者,其中所述参考序列包括至少两种不同HLA分型的等位基因。
17.根据权利要求1所述的方法,其中,所述k聚体具有10-20的长度,或者,其中所述k聚体具有患者序列读段长度的5%至15%之间的长度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南托米克斯有限责任公司,未经南托米克斯有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201680054282.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:新生抗原分析
- 下一篇:对目标分析物的数据集的校准方法