[发明专利]基于转录组的肿瘤新抗原鉴定方法有效
申请号: | 201810101545.X | 申请日: | 2018-02-01 |
公开(公告)号: | CN108491689B | 公开(公告)日: | 2019-07-09 |
发明(设计)人: | 莫凡;陈荣昌;罗凯;马志明;周秀卿;黄灵灵 | 申请(专利权)人: | 杭州纽安津生物科技有限公司 |
主分类号: | G16B30/00 | 分类号: | G16B30/00 |
代理公司: | 杭州天昊专利代理事务所(特殊普通合伙) 33283 | 代理人: | 向庆宁;黄芳 |
地址: | 310051 浙江省杭州市滨*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 转录组 比对结果 测序 计算基因 融合基因 突变检测 表达量 预测 样本 肿瘤 肿瘤特异性抗原 基因表达量 个体样本 患者肿瘤 抗原鉴定 突变位点 肿瘤抗原 肿瘤组织 基因组 结合力 比对 短肽 建库 扩增 参考 分析 | ||
1.基于转录组的肿瘤抗原鉴定方法,其特征在于,包括以下步骤:
S1:获取患者肿瘤组织的RNA样本,对RNA样本建库和扩增,获得肿瘤组织的RNA样本测序结果,根据测序结果鉴定患者的HLA分型;
S2:将RNA样本测序结果的短读段比对到人类参考基因组,获得RNA比对结果;
S3、根据RNA比对结果计算基因表达量,根据RNA比对结果进行突变检测,根据RNA比对结果预测融合基因事件;根据比对结果预测转录组HLA分型;计算基因表达量、突变检测和预测融合基因事件按指定顺序进行,或者同步进行;
S3A:计算基因表达量包含:去除RNA比对结果中的内含子短读段,形成仅由外显子短读段组成的RNA比对结果,计算基因表达量,
计算基因表达量包含以下步骤:
S3A1、去除建库过程中由PCR扩增产生的重复的短读段序列;
S3A2、将比对到内含子的短读段去除,获得由外显子短读段组成的RNA比对结果;
S3A3、计算每个外显子短读段数,用以下公式换算成基因的表达量:
其中total exon reads表示比对到某个外显子区域的总短读段数,mapped reads(millions)表示每1000000条短读段中比对到该区域的短读段数,exon length(KB)表示这段外显子的长度;
S3B:突变检测包含:
S3B1:从RNA比对结果中检测RNA样本中的突变,去掉正常组织的全外显子样本中具有的突变,剩余的突变作为RNA水平的体细胞突变;对RNA的突变进行功能注释;
S3B2:计算突变位点的深度:针对每个突变位点,计算当前突变位点在全外显子测序样本中的深度,全外显子样本包括肿瘤组织的全外显子样本和正常组织的全外显子样本;
S3B3:HLA分型亲和力预测:根据突变的注释结果,针对每一个突变事件编辑相应转录本序列,获得一条包含所有突变的多肽序列,去掉在野生型蛋白序列中可以匹配到的肽段形成转录组特有的新生多肽序列,将转录组特有的多肽序列按照HLA分型结合需要的长度截取成短肽,将短肽与步骤S1的RNA样本测序结果中鉴定的患者HLA分型做亲和力预测;
其中,计算突变位点的深度和HLA分型亲和力预测按指定顺序进行或同步进行;
S3C、预测融合基因事件:根据步骤S2的RNA比对结果预测转录组的融合基因事件,从中筛选出可信的融合基因后,翻译成蛋白序列,将蛋白序列按照HLA分型结合需要的长度截取成短肽;将短肽与步骤S1的RNA样本测序结果中鉴定的患者HLA分型做亲和力预测;
步骤S3B3和S3C中截取短肽的方法为:
SI、顺序获取多肽序列上的突变为当前突变,以当前突变为中心、向前截取n个氨基酸和向后截取m个氨基酸获得多肽序列,n为HLA分型所能呈递的最大长度,m为HLA分型所能呈递的最大长度、或者m为从当前突变到第一个终止密码子的长度;
SII,在多肽序列上依次截取长度为N的短肽,N为HLA分型结合需要的长度;获得N条包含当前突变的短肽;
S4:将转录组样本的基因表达量,转录组突变位点在全外测序样本中的深度,新生短肽与患者HLA分型的亲和力作为分析结果交给下游分析人员。
2.根据权利要求1所述的基于转录组的肿瘤抗原鉴定方法,其特征在于:步骤S2获得基因表达量后,对RNA比对结果进行质控,质控的内容包含:整个捕获区域的覆盖度,平均测序深度,比对率,重复序列的比重和唯一比对reads的比重;若比对结果符合质控要求,则进入S3;若比对结果不符合质控要求,则重新获取样本。
3.根据权利要求2所述的基于转录组的肿瘤抗原鉴定方法,其特征在于:步骤S3B3包含所有突变的多肽序列的获取方法为:根据转录本编号从ensembl数据库中找出相应的CDS区域核苷酸序列,拼接下游3’端序列,按照突变的功能注释将核苷酸序列上相应位置的核苷酸做出修改,得到一条包含所有突变的核苷酸序列;将包含所有突变的转录本核苷酸序列翻译成多肽序列。
4.根据权利要求3所述的基于转录组的肿瘤抗原鉴定方法,其特征在于:步骤SI截取含有突变位点的多肽序列的规则为:
A、对于点突变:以发生突变的位置为中心,向前截取n个氨基酸,向后截取m个氨基酸,n=m=HLA分型所能呈递的最长肽段,若前段或后段长度不足时,则有多少截多少;如果点突变属于stop loss,则m为从当前突变到第一个终止密码子的长度;
B、对于非移码突变:非移码插入要从插入序列的第一个氨基酸向前截取n个氨基酸;从插入序列的最后一个氨基酸向后截取m氨基酸,n=m=HLA分型所能呈递的最长肽段;以插入序列为中心,插入序列、插入序列之前的n个氨基酸和插入序列之后的m个氨基酸共同组成新生多肽序列;
非移码缺失则以缺失位点为中心,分别向前截取n个氨基酸,向后截取m个氨基酸,n=m=HLA分型所能呈递的最长肽段;
C、对于移码突变:从开始移码突变的第一个氨基酸为中心,向前截取n个氨基酸,n=HLA分型所能呈递的最长肽段;向后截取m个氨基酸,m为从当前突变到第一个终止密码子的长度,即向后截取至第一个终止密码子。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州纽安津生物科技有限公司,未经杭州纽安津生物科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810101545.X/1.html,转载请声明来源钻瓜专利网。