[发明专利]一种肿瘤新生抗原的鉴定方法有效
申请号: | 201810101691.2 | 申请日: | 2018-02-01 |
公开(公告)号: | CN108388773B | 公开(公告)日: | 2019-11-19 |
发明(设计)人: | 莫凡;陈荣昌;罗凯;马志明;周秀卿;黄灵灵 | 申请(专利权)人: | 杭州纽安津生物科技有限公司 |
主分类号: | G16B30/10 | 分类号: | G16B30/10;G16B20/50;G16B20/30 |
代理公司: | 33283 杭州天昊专利代理事务所(特殊普通合伙) | 代理人: | 向庆宁;黄芳<国际申请>=<国际公布>= |
地址: | 310051 浙江省杭州市滨*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 肿瘤特异性抗原 个体样本 分析 参考依据 分析效率 正常细胞 肿瘤细胞 基因组 抗原 比对 肿瘤 诊断 参考 医生 | ||
1.一种肿瘤新生抗原的鉴定方法,包括以下步骤:
S1:获取肿瘤患者的正常细胞测序结果和癌变细胞测序结果;
S2:分别将正常细胞测序结果的短读段序列和癌变细胞测序结果的短读段序列比对到人类参考基因组,分别获得正常细胞的比对结果和癌变细胞的比对结果;
S3:从短读段的比对结果中检出所有可信的突变并进行功能注释,突变包含胚系突变和体细胞突变,功能注释的范围包含所有突变;
S4:根据突变的注释结果,罗列出所有由这些突变或突变的组合而产生的抗原肽段;
S4.1、根据转录本编号从ensembl数据库中找出正常的核苷酸序列,按照突变的功能注释将核苷酸序列上相应位置的核苷酸做出修改,得到一条包含所有突变的核苷酸序列;
S4.2、将包含所有突变的转录本核苷酸序列翻译成多肽序列;
S4.3、顺序获取多肽序列上的突变为当前突变,以当前突变为中心、向前截取n个氨基酸和向后截取m个氨基酸获得多肽序列,n为HLA分型所能呈递的最大长度,m为HLA分型所能呈递的最大长度、或者m为从当前突变到第一个终止密码子的长度;m≥n;
S4.4、在多肽序列依次截取长度为N的短肽,N为HLA分型结合需要的长度,将包含当前突变的N条短肽用于步骤6;
S5:从步骤S1中的正常细胞测序结果获得正常细胞的HLA分型,和从步骤S1中的癌变细胞测序结果获得癌变细胞的HLA(人类白细胞抗原)分型,分别预测正常细胞的HLA分型和癌变细胞的HLA分型与步骤S4获得抗原肽段在细胞环境的结合能力;
S6:筛选出与患者HLA分型结合能力好的抗原肽段;
S7:从步骤S6筛选出的抗原肽段中找出肿瘤抗原。
2.根据权利要求1所述的一种肿瘤新生抗原的鉴定方法,其特征在于:步骤S2获得比对结果后,对比对结果进行质控,质控的内容包含:整个捕获区域的覆盖度,平均测序深度,比对率,重复序列的比重和唯一比对短读段的比重;若比对结果符合质控要求,则进入S3;若比对结果不符合质控要求,则重新获取样本,重复步骤S1和S2。
3.根据权利要求2所述的一种肿瘤新生抗原的鉴定方法,其特征在于:对步骤S2获得的比对结果进行优化,优化包括针对插入缺失区域的重新比对和目标区域碱基质量的修正,得到肿瘤细胞的优化比对结果和正常细胞的优化比对结果。
4.根据权利要求3所述的一种肿瘤新生抗原的鉴定方法,其特征在于:步骤S2中,正常细胞测序结果的短读段序列比对到人类参考基因组和肿瘤细胞测序结果的短读段序列比对到人类参考基因组同步进行。
5.根据权利要求书1所述的一种肿瘤新生抗原的鉴定方法,其特征在于:步骤S3功能注释的范围包含突变区域,基因,转录本,碱基变化,氨基酸变化,clinvar,千人基因组,esp6500,dbsnp,cosmic,polyphen,sift,膜蛋白结构,癌症相关基因。
6.根据权利要求5所述的一种肿瘤新生抗原的鉴定方法,其特征在于:步骤S3检出所有可信的突变的方法为:
S3.1、得到肿瘤细胞的优化比对结果和正常细胞的优化比对结果,检测肿瘤细胞和正常细胞的胚系突变位点;
S3.2、对得到的胚系突变位点和体细胞突变位点进行过滤获得可信的突变;
S3.3、对筛选出的体细胞突变和胚系突变进行注释。
7.根据权利要求1所述的一种肿瘤新生抗原的鉴定方法,其特征在于:步骤S4.1中形成核苷酸序列的方法为:按照转录本编号从数据库中找出CDS序列,在CDS序列后拼接上3’UTR区域的序列形成核苷酸序列。
8.根据权利要求7所述的一种肿瘤新生抗原的鉴定方法,其特征在于:步骤S4.3的截取的规则为:
A、对于点突变:以发生突变的位置为中心,向前截取n个氨基酸,向后截取m个氨基酸,n=m=HLA分型所能呈递的最长肽段,若前段或后段长度不足时,则有多少截多少;如果点突变属于stoploss,则m为从当前突变到第一个终止密码子的长度;
B、对于非移码突变:非移码插入要从插入序列的第一个氨基酸向前截取n个氨基酸;从插入列的最后一个氨基酸向后截取m氨基酸,n=m=HLA分型所能呈递的最长肽段;以插入序列为中心,插入序列、插入序列之前的n个氨基酸和插入序列之后的m个氨基酸和共同组成多肽序列;
非移码缺失则以缺失位点为中心,分别向前截取n个氨基酸,向后截取m个氨基酸,n=m=HLA分型所能呈递的最长肽段;
C、对于移码突变:从开始移码突变的第一个氨基酸为中心,向前截取n个氨基酸,n=HLA分型所能呈递的最长肽段;向后截取m个氨基酸,m为从当前突变到第一个终止密码子的长度,即向后截取至第一个终止密码子。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州纽安津生物科技有限公司,未经杭州纽安津生物科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810101691.2/1.html,转载请声明来源钻瓜专利网。