[发明专利]预测肿瘤新生抗原的方法、装置及存储介质有效
申请号: | 201811531729.6 | 申请日: | 2018-12-14 |
公开(公告)号: | CN109584960B | 公开(公告)日: | 2021-07-30 |
发明(设计)人: | 叶浩;李祥永;戴珩 | 申请(专利权)人: | 序康医疗科技(苏州)有限公司 |
主分类号: | G16B20/50 | 分类号: | G16B20/50;G16B50/00 |
代理公司: | 上海智信专利代理有限公司 31002 | 代理人: | 王洁;豆欣欣 |
地址: | 215123 江苏省苏州市苏州工*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 预测 肿瘤 新生 抗原 方法 装置 存储 介质 | ||
1.一种预测肿瘤新生抗原的方法,其特征在于,所述的方法包括步骤:
(1)根据肿瘤-胚系对照样本进行体细胞突变以及基因融合检测;
(2)针对每一对融合基因生成融合肽及相应野生肽;
(3)基于每个体细胞突变生成单突变肽及相应野生肽;
(4)构建肿瘤样本特异的个人基因组并生成含有多个突变的多突变肽;
(5)通过突变间的顺式反式关系,判断单突变以及多突变的突变肽真伪,生成真实存在的突变肽;
(6)去除与野生型蛋白其它位置序列完全一致的突变肽,构建完整的新生多肽库;
(7)基于胚系对照样本的bam文件进行HLA分子分型检测,预测新生多肽与HLA分子的亲和力,将亲和力高的新生多肽作为候选肿瘤新生抗原;
在所述的步骤(2)中,融合断点注释,采用AGFusion工具根据5’端、3’端断点在基因组上的坐标信息,注释融合断点,并生成融合后的蛋白序列全长;截取长度为L且含有融合断点的融合肽以及对应的5’端、3’端野生肽,具体的截取规则为:
确定5’端融合断点在长度为p5的5’端野生蛋白以及长度为g的融合蛋白上的坐标索引:比对融合蛋白与5’端野生蛋白序列,得出最大的一致性片段序列seq1、以及seq1的5’端野生蛋白上的坐标索引m、融合蛋白上的坐标索引t,所述的seq1的长度为s1,则5’端断点的坐标索引在野生型蛋白上为m+s1,在融合蛋白上为t+s1;
确定3’端融合断点在长度为p3的3’端野生蛋白上的坐标索引:比对融合蛋白与3’端野生蛋白,得出最大一致性片段序列seq2以及seq2在3’端野生蛋白上的坐标索引n,所述的seq2的长度为s2;
截取长度为L的融合肽以及相应5’和3’端野生肽:
在3’端融合断点不造成移码框改变的情况下,每一条融合肽均有相对5’端以及3’端两条野生肽生成,融合蛋白从最小坐标索引t+s1-L到最大坐标索引t,截取长度为L的融合肽;5’端野生蛋白从最小坐标索引m+s1-L到最大坐索引m,3’端野生蛋白从n-L到最大坐标索引n,截取长度为L的两条相应的野生肽;
当3’端融合断点造成移码框改变时,每一条融合肽只有一条5’端野生肽生成,融合蛋白从最小坐标索引t+s1-L到最大坐标索引g-L,截取长度为L的融合肽,5’端野生蛋白从最小坐标索引m+s1-L到最大坐标索引p5-L,顺序生成相应长度为L的野生肽。
2.根据权利要求1所述的预测肿瘤新生抗原的方法,其特征在于,所述的步骤(1)的中:
对于体细胞突变,在Mutect2工具的默认参数下输出体细胞突变结果之后,进行进一步质控过滤,所述的质控过滤包括:突变频率大于2%;突变点的测序深度大于10;至少有2条reads指示有突变且该reads的平均碱基质量20;
对于基因融合检测,若输入为全外显子WES或全基因组WGS测序数据,则用FACTERA工具在默认参数下检测基因融合;若输入为RNAseq数据,则用STAR-Fusion工具在默认参数下检测基因融合,然后通过junction reads数目≥1,做进一步的质控以减少假阳性,该junction reads指为直接覆盖融合断点的reads。
3.根据权利要求1所述的预测肿瘤新生抗原的方法,其特征在于,所述的步骤(3)中,
使用SnpEff注释,将每一个体细胞基因组上的碱基突变注释到Ensembel数据库上的每一个转录本以及相应蛋白序列上;
截取长度为L的突变肽以及相应的野生肽。
4.根据权利要求3所述的预测肿瘤新生抗原的方法,其特征在于,截取规则为:
对于错义突变、非移码突变,以突变坐标为中心,向5’端取L-1个氨基酸,向3’端取L-1个氨基酸,生成长度为8~11个氨基酸长度以及13~25个氨基酸长度之间的含有突变氨基酸的突变段以及相应野生肽;
对于典型单点突变,生成38对长度为8~11个氨基酸长度的突变型-野生型肽段,以及247对长度为13~25个氨基酸长度的突变型-野生型肽段;
对于移码突变,从突变点的前L-1个氨基酸开始,延伸到第一个终止子出现为止,生成8~11以及13~25氨基酸长度的突变肽段及相应坐标的野生肽段。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于序康医疗科技(苏州)有限公司,未经序康医疗科技(苏州)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811531729.6/1.html,转载请声明来源钻瓜专利网。